服务器端语音识别

时间:2010-06-24 21:04:41

标签: cloud speech-recognition

任何人都知道已经托管的任何好的服务器端语音识别引擎?即我希望能够调用一个简单的Web API发布一些声音数据并获取文本。不必是免费的 - 但希望可以免费试用。

1 个答案:

答案 0 :(得分:33)

有几种IVR服务将整个VOIP会话(电话呼叫)作为一个完整的应用程序托管,而不是提供单个服务交易“àlacarte”。如果您要使您的程序看起来像VOIP呼叫,您可以使用其中一些服务完成它。

Voxeo发布了list of free (and low cost) IVR hosting providers针对有限使用的开发人员。毫不奇怪,所有都需要注册。

另一种可能性是与VlingoTwilioTropo进行直接查询,因为它们可能会向您推销您所需要的内容。

更新:2012年7月25日

AT& T宣布推出Speech API。您发送音频 - 它返回XML或JSON数据格式的文本。另见developer site

更新:2012年8月27日

另一种可能性是来自Nuance的Dragon Mobile SDK,它面向寻求API的个人开发者,使消费者应用程序具有语音和/或文本到语音功能。

更新:2012年9月21日

似乎有几个新的提供商提供完全您正在寻找的内容:语音样本,文本输出。以下列于Programmable Web

另请注意,Loquendo现在是Nuance的一部分。

更新:2013年6月27日

AT& T的Speech API有一个few targeted SDKsAndroid,iOS,PhoneGap,Titanium,W​​indows) - 其中一些托管在GitHub上。甚至有source for a Unity 3D demo

更新:2014年1月23日

OneTok已将其产品重新制定为iOSAndroid的SDK。

显然 Voice Genie 产品已被Genesys彻底消化,因此可以找到它的一点痕迹。鉴于Genesys对大型企业的定位,很难知道他们是否有任何小批量或商品供应。

Plumvoice似乎扩大了他们的产品。

与之前的许多人一样,Vlingo现在是Nuance的一部分。

(我试图在原始答案中更新任何损坏的链接。)

更新:2015年10月31日

让这个答案保持最新是一个Sisyphean任务。

Voxeo的免费(和低成本)IVR托管服务提供商名单现在重新发布到AT&T Speech API,在完整披露中,我现在已经在其中进行了实质性的参与,因此,取消了我提供链接的资格几乎任何事情都没有打击我的信誉。

也就是说,演讲/ NLP市场中有很多玩家。尽职尽责。

更新:2016年4月8日

所以现在Google is totally upsetting the apple cart