Wolfram 语言

构建一个支持音频的问答系统

下面的例子显示音频信号和文本转录之间的转换如何启用大范围的语音应用程序,例如使用录制的问题和合成的答案回答文字问题。可以使用 SpeechRecognize 将语音转换为文本,也可以通过 SpeechSynthesize 将文本转换为语音。

首先下载总统就职演说文本。

选择其中一个演讲的一部分作为问答的上下文。

AudioCapture 录制问题。

SpeechRecognize 转录录制的问题。

现在,用文本处理来回答问题。通过 FindTextualAnswer 确定问题的最可能的答案。

通过 SpeechSynthesize 将结果转换为 Audio 对象。还可以从 $VoiceStyles 中选择两种不同的声音来分别表示背景和答案。

定义一个函数,用特定声音为给定输入合成语音。

合成并组合各个部分的语音。

相关范例

de en es fr ja ko pt-br