通用文本到语音语音

时间:2012-05-21 11:07:54

标签: text-to-speech

是否(或可能有)通用 TTS语音,即与某种语言(如英语或德语)无关的语音?

我正在寻找一种方法,使用相同的语音阅读不同国家/地区的街道名称。

1 个答案:

答案 0 :(得分:3)

目前,没有(我知道,或者搜索出现了)。

这是因为大多数高质量的TTS引擎都依赖于预先录制的单词。对于这样的TTS,用所有语言的SAME语音说话,这意味着同一个人用所有这些语言记录他/她的声音。今天大约有6500种语言,用一种语言录制字典,大约需要一个月。因此,要记录所有语言,需要541年。那个人到那时就已经死了。 请注意,这是夸大其词:人们不需要逐字逐句地记录字典。

完成此任务需要完全由计算机生成的语音。然而,即使这被分成方言,因为法国强调不同的字母,然后说,西班牙语。如果不是,那么你可能会有TTS引擎讲Fringlish。

鉴于您在不同国家/地区的街道名称,最佳解决方案是使用espeak。它内置了很多语言,并且听起来总是一样的:机器人,没有情感。它可以通过命令行调用,因此几乎可以用于任何编程语言。

如果您知道街道所在的国家/地区,您可以拥有一个数据库,其中包含他们在不同国家/地区所使用的语言。我之前曾使用geonames数据库,它运行良好。然后,您可以使用您想要说出的文本和语言来调用espeak。 Geonames提供每日dump,您可以下载并提取语言。然后,您可以将大量数据库存储在服务器上,例如Dotcloud。或者,您可以使用他们的API,但这仅限于每天使用30,000次。

如果您不知道街道所在的国家/地区是哪种语言,您可以采用更粗略的方法,这种方法并不总是有效。语言检测。由于大多数街道名称是不同国家/地区的真实字词,例如“主街”,您可以运行语言检测,并找出使用哪种语言。我听说detectlanguage.com对此有好处。

所以,虽然没有现成的方法,但你可以自己制作一个,没有太多麻烦。

相关问题