テキスト認識で音符を読む
音楽の世界では,タブ譜(tabulature)は楽器の指の位置を示す方法である.
この例では,テキスト認識を使ってタブ譜の表記を読み取り,音楽を演奏するシミュレーションを生成する方法を示す.
レッド・ツェッペリン(Led Zeppelin)の歌のタブ譜を取る.
テキストの場所を見付けるために,まず音符の各行に対応する境界ボックスを見付ける.このタスクを実行するためには,従来の画像処理アプローチで十分である.
完全なWolfram言語入力を表示する
局所化がかなり正確であることを目で確かめることができる.
テキストの位置を前もって計算しておいたので,認識を開始する.
完全なWolfram言語入力を表示する
認識から可能なノイズを除去する必要がある.例えば,「0」という文字の中には,使われているフォントによっては「o」と解釈されるものもある.
ここで文字列を音符のリストに変換する.各行の最後の文字はストップ文字なので,これは除去する.
完全なWolfram言語入力を表示する
音楽にするためには,リストをコードのリストに変換し,適切な旋律を適用する必要がある.
完全なWolfram言語入力を表示する
すべてのステップをまとめると,レッド・ツェッペリンの歌が認識ができる.
完全なWolfram言語入力を表示する