针对非英语语言的语音转换

时间:2015-05-05 06:42:10

标签: speech-recognition speech-to-text cmusphinx

我正在尝试为非英语语言实现天真的语音转换。用户说其他语言,文本也使用同一种语言。这可能吗?如果是,任何人都可以帮助解决如何实施它的想法吗?非常感谢任何帮助。谢谢。

1 个答案:

答案 0 :(得分:2)

任何商业语音识别解决方案都不太可能支持Sanskrit,因此您唯一的选择是将梵语支持添加到CMUSphinx等开源引擎中。

这非常简单,您实际上只需要按照文档进行操作即可。您还需要了解脚本语言,这将有助于您在某些步骤中减少手动工作。

  1. 阅读简介 - CMUSphinx教程介绍成为 熟悉语音识别的概念 - 特征,声学 模型,语言模型等

  2. 尝试用美国英语模型CMUSphinx来了解事情 工作。尝试使用美国英语AN4数据库进行训练。

  3. 在维基百科中了解您的语言

  4. 为您的语言收集一组转录录音 - 采访,有声读物或自己录制。

  5. 根据您收集的数据,创建一个单词列表和一个 语音字典。大多数语音词典都可以创建 使用您喜欢的脚本中的小脚本的简单规则 像Python这样的语言。请参阅Generating a dictionary for details

  6. 手动或使用sphinx4将音频分段为短句 对齐器,使用所需文件创建数据库,如中所述 培训教程Training Acoustic Model For CMUSphinx

  7. 将新模型集成到您的应用程序中并设计数据 收集以改善您的模型。

  8. 如果您有任何疑问,请随时提出。 This paper也可能对你有帮助。

    相关问题是:

    Burmese speech to text conversion in android?

    Writing speech-recognition engine

    Is it possible to write a speech-recognition engine from scratch?