针对盲人的JavaScript语音转文本

时间:2012-06-28 09:15:04

标签: javascript html5 google-chrome speech-recognition speech-to-text

我正在开发一个网站,我想帮助盲人用语音来使用它,所以我会用:

  • 文字转语音,为用户提供一些可能性
  • 语音转文字,允许用户使用自己的语音选择一个

我已经有了一些文本到语音的JavaScript库(比如speak.js),但现在我需要一个很好的语音到文本。有一些解决方案用于此目的(如speechapi),但它们使用Java Applet或Flash,我只想依赖JavaScript,以避免插件。

我正在尝试使用x-webkit-speech和Google Chrome进行HTML5的语音输入,这很好,但你需要点击一个图标(盲人不能很好地使用鼠标)。使用x-webkit-speech按键是否可行?你知道任何替代API(JavaScript)吗?

谢谢!

2 个答案:

答案 0 :(得分:4)

使用按键的x-webkit-speech是否可行?

根据此post和此post,您无法通过点击麦克风来覆盖语音的开头。

x-webkit-speech正在做的是使用HTML5的音频捕获功能并将音频发送到Google的服务器进行处理,并以JSON格式返回结果。这blogger has reversed engineered it。您可以开发一个JavaScript库,查找按键以开始在支持HTML5的浏览器上捕获音频,并将其发送到Google的服务或您创建的服务。使用Google服务的缺点是它是一个不受支持的API,可能随时更改。开发自己的服务的缺点是开发和维护成本很高。

您知道其他任何API(JavaScript)吗?

post和此post列出了一些可用于语音识别的服务。我没有看到Nuance上市。您可以使用Dragon Mobile SDK来实现此目的。您可能需要查看ISpeech

答案 1 :(得分:2)

谷歌翻译是非常好的文本到语音引擎。我曾经用它读过文字。例如,您有一个文本:welcome to Stack overflow,您可以像这样调用

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input

然后使用浏览器音频播放

对于语音输入,您可以手动激活收听过程,请参见此处 http://code.google.com/chrome/extensions/experimental.speechInput.html