Wolfram言語

テキスト認識で音符を読む

音楽の世界では,タブ譜(tabulature)は楽器の指の位置を示す方法である.

この例では,テキスト認識を使ってタブ譜の表記を読み取り,音楽を演奏するシミュレーションを生成する方法を示す.

レッド・ツェッペリン(Led Zeppelin)の歌のタブ譜を取る.

テキストの場所を見付けるために,まず音符の各行に対応する境界ボックスを見付ける.このタスクを実行するためには,従来の画像処理アプローチで十分である.

完全なWolfram言語入力を表示する

局所化がかなり正確であることを目で確かめることができる.

テキストの位置を前もって計算しておいたので,認識を開始する.

完全なWolfram言語入力を表示する

認識から可能なノイズを除去する必要がある.例えば,「0」という文字の中には,使われているフォントによっては「o」と解釈されるものもある.

ここで文字列を音符のリストに変換する.各行の最後の文字はストップ文字なので,これは除去する.

完全なWolfram言語入力を表示する

音楽にするためには,リストをコードのリストに変換し,適切な旋律を適用する必要がある.

完全なWolfram言語入力を表示する

すべてのステップをまとめると,レッド・ツェッペリンの歌が認識ができる.

完全なWolfram言語入力を表示する

関連する例

de en es fr ko pt-br zh