譜面はただの構造化データです。エージェントに任せましょう。
音楽家は、記譜を読み書きする方法を何年もかけて学びます。しかし開発者の視点から見ると、譜面は構造化データです。音符がグリッド上に並び、時間、音高、強さの値を持つデータです。そして構造化データこそ、AIエージェントが最も得意とする分野です。
Cursor で AnyCap を使えば、エージェントは音声を譜面に文字起こしし、練習用スコアを大量生成し、形式変換を行い、かつては専用ソフトと訓練された作曲家が必要だった作曲ワークフローを自動化できます。方法を見ていきましょう。
AI 音楽作曲の現状
従来の楽譜ソフトは、何をすべきかすでに分かっている人向けに作られています。
| ツール | 種類 | 最適用途 |
|---|---|---|
| MuseScore | オープンソース記譜 | フルスコア、コミュニティ主導 |
| Sibelius | プロ向け記譜 | オーケストラ、出版品質 |
| Dorico | モダンな記譜エンジン | 複雑な現代曲のスコア |
| Noteflight | Webベースの記譜 | 教育、素早い編曲 |
| ScoreCloud | AI支援の文字起こし | 音声 → 記譜変換 |
| AnthemScore | AI文字起こし | 音声からMIDIへの自動変換 |
これらのツールは強力ですが、ワークフローは同じです。アプリを開き、新しいスコアを作成し、音符を一つずつ置き、書き出す。100個の練習問題用に譜面を生成したい、20個の音声ファイルを文字起こししたい、学校バンドの全楽器向けに編曲したい、といった場面では手作業は破綻します。
AIエージェントで自動化できること
音声から記譜への文字起こし
AnyCap エージェントに MP3 を渡すと、譜面が返ってきます。エージェントは音声を ScoreCloud や AnthemScore のような文字起こしモデルに通し、出力を MusicXML または PDF に整えます。
agent prompt: "この音声ファイルをピアノ用の譜面に文字起こしして、PDFで出力して"
→ agent: [音声を処理 → 記譜 → Piano_Transcription.pdf を出力]
キーワード 音楽を文字起こしできる ai はありますか は月間 1,600 回検索されています。人が探しているのはまさにこれです。
スコアの一括生成
教師、コンテンツ制作者、教育プラットフォームは、音階、アルペジオ、初見練習など、何百もの練習用スコアを必要とします。エージェントなら、それらをすべてプログラムで生成できます。
keys = ["C", "G", "D", "A", "E", "B", "F#", "Db", "Ab", "Eb", "Bb", "F"]
for key in keys:
agent.generate_score(
type="major_scale",
key=key,
instrument="piano",
output=f"./exercises/{key}_major_scale.pdf"
)
12 の音階、12 の PDF、手作業の音符配置はゼロです。
形式変換
MIDI から MusicXML。MusicXML から PDF。音声から MIDI。ピアノロールから譜面。こうした変換は、記譜ソフトでは面倒な手作業になりがちです。エージェントはファイル変換として扱います。形式 A を読み、形式 B を書き出すだけです。
複数楽器の編曲
メロディが一つあれば、エージェントはどんな編成にも対応したアレンジを生成できます。
agent prompt: "このピアノのメロディを弦楽四重奏用に編曲して"
→ agent outputs: violin_I.pdf, violin_II.pdf, viola.pdf, cello.pdf, full_score.pdf
エージェント駆動の作曲パイプライン
以前なら 3 つの異なるツールと訓練された演奏者が必要だった、完全なワークフローです。
- 入力 — メロディの音声ファイル(MP3、WAV、あるいはスマホ録音)
- 文字起こし — エージェントが文字起こしモデルを使って音声を MIDI に変換
- 整形 — エージェントがタイミングをクオンタイズし、明らかな音程ミスを修正
- 編曲 — エージェントが対象楽器向けのパートを生成
- 記譜 — エージェントが MusicXML にレンダリングし、その後 PDF に変換
- 納品 — ファイルは名前付きで整理され、プロジェクトフォルダに配置される
これらすべてが、AnyCap が各ステップをオーケストレーションする Cursor の中で起こります。パイプラインを一度説明すれば、あなたが入れたすべてのファイルに対してエージェントが実行します。
なぜ作曲ワークフローに AnyCap なのか
単体の記譜ツールは、人間が操作することを前提にしています。AnyCap はエージェントが操作することを前提にしています。そして、それがアーキテクチャを変えます。
| タスク | 単体ツール | AnyCap エージェント |
|---|---|---|
| 1 トラックを文字起こし | ツールを開く、音声を取り込む、待つ、書き出す | エージェントがバックグラウンドで処理 |
| 20 トラックを文字起こし | 上記を 20 回繰り返す | エージェントが 20 件すべてを処理 |
| 練習用スコアを生成 | 各スコアを手動で作成 | テンプレートから生成 |
| MIDI を PDF に変換 | 記譜ツールで MIDI を開き、PDF に印刷 | エージェント: MIDI を読み、PDF を書く |
| アンサンブル用に編曲 | 各パートを手動で作成 | エージェントが全パートを生成 |
違いは機能ではなく、規模です。文字起こし 1 件は簡単です。50 件は、エージェントがいて初めて簡単になります。
実際の活用例
音楽教育プラットフォームは、エージェント駆動の作曲で、各生徒向けの個別練習シートを生成します。初心者にはハ長調の音階、上級者には変拍子の半音階練習。どちらも同じエージェントテンプレートから生成されます。
コンテンツ制作者は、ロイヤリティフリーの音声を文字起こしして、視聴者向けの譜面を作成します。トラックをアップロードし、記譜を得て、公開する。すべて自動化できます。
ゲーム開発者は、プレイヤーの挙動に応じて変化する適応型の譜面を生成します。エージェントがゲーム状態を監視し、レンダラーがリアルタイム音声に変換する MusicXML を出力します。
はじめる
AnyCap をインストールして Cursor を開き、次を試してください。
transcribe this audio to sheet music for piano, output as PDF
エージェントが文字起こし、記譜、書き出しを担当します。PDF はプロジェクトに表示されます。楽譜ソフトは不要です。
さらに見る: programmatic music generation for developers | 8-bit music with AI agents | AI music APIs compared