AIエージェントで作曲を自動化する

AIエージェントで譜面、記譜、スコア生成を自動化。音声からMIDIへの文字起こしから一括作曲まで、AnyCapエージェントがCursor内で音楽制作ワークフローをどう扱うかを紹介します。

譜面はただの構造化データです。エージェントに任せましょう。

音楽家は、記譜を読み書きする方法を何年もかけて学びます。しかし開発者の視点から見ると、譜面は構造化データです。音符がグリッド上に並び、時間、音高、強さの値を持つデータです。そして構造化データこそ、AIエージェントが最も得意とする分野です。

Cursor で AnyCap を使えば、エージェントは音声を譜面に文字起こしし、練習用スコアを大量生成し、形式変換を行い、かつては専用ソフトと訓練された作曲家が必要だった作曲ワークフローを自動化できます。方法を見ていきましょう。

AI 音楽作曲の現状

従来の楽譜ソフトは、何をすべきかすでに分かっている人向けに作られています。

ツール	種類	最適用途
MuseScore	オープンソース記譜	フルスコア、コミュニティ主導
Sibelius	プロ向け記譜	オーケストラ、出版品質
Dorico	モダンな記譜エンジン	複雑な現代曲のスコア
Noteflight	Webベースの記譜	教育、素早い編曲
ScoreCloud	AI支援の文字起こし	音声 → 記譜変換
AnthemScore	AI文字起こし	音声からMIDIへの自動変換

これらのツールは強力ですが、ワークフローは同じです。アプリを開き、新しいスコアを作成し、音符を一つずつ置き、書き出す。100個の練習問題用に譜面を生成したい、20個の音声ファイルを文字起こししたい、学校バンドの全楽器向けに編曲したい、といった場面では手作業は破綻します。

AIエージェントで自動化できること

音声から記譜への文字起こし

AnyCap エージェントに MP3 を渡すと、譜面が返ってきます。エージェントは音声を ScoreCloud や AnthemScore のような文字起こしモデルに通し、出力を MusicXML または PDF に整えます。

agent prompt: "この音声ファイルをピアノ用の譜面に文字起こしして、PDFで出力して"
→ agent: [音声を処理 → 記譜 → Piano_Transcription.pdf を出力]

キーワード 音楽を文字起こしできる ai はありますか は月間 1,600 回検索されています。人が探しているのはまさにこれです。

スコアの一括生成

教師、コンテンツ制作者、教育プラットフォームは、音階、アルペジオ、初見練習など、何百もの練習用スコアを必要とします。エージェントなら、それらをすべてプログラムで生成できます。

keys = ["C", "G", "D", "A", "E", "B", "F#", "Db", "Ab", "Eb", "Bb", "F"]
for key in keys:
    agent.generate_score(
        type="major_scale",
        key=key,
        instrument="piano",
        output=f"./exercises/{key}_major_scale.pdf"
    )

12 の音階、12 の PDF、手作業の音符配置はゼロです。

形式変換

MIDI から MusicXML。MusicXML から PDF。音声から MIDI。ピアノロールから譜面。こうした変換は、記譜ソフトでは面倒な手作業になりがちです。エージェントはファイル変換として扱います。形式 A を読み、形式 B を書き出すだけです。

複数楽器の編曲

メロディが一つあれば、エージェントはどんな編成にも対応したアレンジを生成できます。

agent prompt: "このピアノのメロディを弦楽四重奏用に編曲して"
→ agent outputs: violin_I.pdf, violin_II.pdf, viola.pdf, cello.pdf, full_score.pdf

エージェント駆動の作曲パイプライン

以前なら 3 つの異なるツールと訓練された演奏者が必要だった、完全なワークフローです。

入力 — メロディの音声ファイル（MP3、WAV、あるいはスマホ録音）
文字起こし — エージェントが文字起こしモデルを使って音声を MIDI に変換
整形 — エージェントがタイミングをクオンタイズし、明らかな音程ミスを修正
編曲 — エージェントが対象楽器向けのパートを生成
記譜 — エージェントが MusicXML にレンダリングし、その後 PDF に変換
納品 — ファイルは名前付きで整理され、プロジェクトフォルダに配置される

これらすべてが、AnyCap が各ステップをオーケストレーションする Cursor の中で起こります。パイプラインを一度説明すれば、あなたが入れたすべてのファイルに対してエージェントが実行します。

なぜ作曲ワークフローに AnyCap なのか

単体の記譜ツールは、人間が操作することを前提にしています。AnyCap はエージェントが操作することを前提にしています。そして、それがアーキテクチャを変えます。

タスク	単体ツール	AnyCap エージェント
1 トラックを文字起こし	ツールを開く、音声を取り込む、待つ、書き出す	エージェントがバックグラウンドで処理
20 トラックを文字起こし	上記を 20 回繰り返す	エージェントが 20 件すべてを処理
練習用スコアを生成	各スコアを手動で作成	テンプレートから生成
MIDI を PDF に変換	記譜ツールで MIDI を開き、PDF に印刷	エージェント: MIDI を読み、PDF を書く
アンサンブル用に編曲	各パートを手動で作成	エージェントが全パートを生成

違いは機能ではなく、規模です。文字起こし 1 件は簡単です。50 件は、エージェントがいて初めて簡単になります。

実際の活用例

音楽教育プラットフォームは、エージェント駆動の作曲で、各生徒向けの個別練習シートを生成します。初心者にはハ長調の音階、上級者には変拍子の半音階練習。どちらも同じエージェントテンプレートから生成されます。

コンテンツ制作者は、ロイヤリティフリーの音声を文字起こしして、視聴者向けの譜面を作成します。トラックをアップロードし、記譜を得て、公開する。すべて自動化できます。

ゲーム開発者は、プレイヤーの挙動に応じて変化する適応型の譜面を生成します。エージェントがゲーム状態を監視し、レンダラーがリアルタイム音声に変換する MusicXML を出力します。

はじめる

AnyCap をインストールして Cursor を開き、次を試してください。

transcribe this audio to sheet music for piano, output as PDF

エージェントが文字起こし、記譜、書き出しを担当します。PDF はプロジェクトに表示されます。楽譜ソフトは不要です。

さらに見る: programmatic music generation for developers | 8-bit music with AI agents | AI music APIs compared