Wolfram言語

音声に対応する質問応答システムを構築する

この例では,音声信号とテキスト表記の間の変換が,録音した質問と合成された答を使ったテキスト形式の質問応答のような,幅広い音声対応アプリケーションをどのように可能にするかを示す.音声はSpeechRecognizeを使ってテキストに変換され,テキストはSpeechSynthesizeを使って音声に変換される.

大統領就任演説のテキストをダウンロードすることから始める.

演説の一つから一部分を選択し,質問に答えるためのコンテキストとして使う.

次に,AudioCaptureを使って質問を録音する.

録音した質問をSpeechRecognizeを使って転写する.

これで,テキスト処理を使って質問に答えることができる.FindTextualAnswerを使って質問に対して最も可能性が高い答を識別する.

SpeechSynthesizeを使って結果をAudioオブジェクトに変換する.$VoiceStylesから異なる2つの声を選んで周囲のコンテキストと答をそれぞれ表すことができる.

指定された入力に対して特定の声を使って音声を合成する関数を定義する.

音声の各部分を合成して繋ぎ合せる.

関連する例

en