text-to-speech - 通用文本到语音语音

目前，没有（我知道，或者搜索出现了）。

这是因为大多数高质量的TTS引擎都依赖于预先录制的单词。对于这样的TTS，用所有语言的SAME语音说话，这意味着同一个人用所有这些语言记录他/她的声音。今天大约有6500种语言，用一种语言录制字典，大约需要一个月。因此，要记录所有语言，需要541年。那个人到那时就已经死了。 请注意，这是夸大其词：人们不需要逐字逐句地记录字典。

完成此任务需要完全由计算机生成的语音。然而，即使这被分成方言，因为法国强调不同的字母，然后说，西班牙语。如果不是，那么你可能会有TTS引擎讲Fringlish。

鉴于您在不同国家/地区的街道名称，最佳解决方案是使用espeak。它内置了很多语言，并且听起来总是一样的：机器人，没有情感。它可以通过命令行调用，因此几乎可以用于任何编程语言。

如果您知道街道所在的国家/地区，您可以拥有一个数据库，其中包含他们在不同国家/地区所使用的语言。我之前曾使用geonames数据库，它运行良好。然后，您可以使用您想要说出的文本和语言来调用espeak。 Geonames提供每日dump，您可以下载并提取语言。然后，您可以将大量数据库存储在服务器上，例如Dotcloud。或者，您可以使用他们的API，但这仅限于每天使用30,000次。

如果您不知道街道所在的国家/地区是哪种语言，您可以采用更粗略的方法，这种方法并不总是有效。语言检测。由于大多数街道名称是不同国家/地区的真实字词，例如“主街”，您可以运行语言检测，并找出使用哪种语言。我听说detectlanguage.com对此有好处。

所以，虽然没有现成的方法，但你可以自己制作一个，没有太多麻烦。

通用文本到语音语音

1 个答案: