南岛语言翻译

时间:2010-01-02 14:33:20

标签: translation

谷歌翻译对于大多数主要语言来说都很棒,但是如果你想制作自己的翻译引擎,你甚至可以从哪里开始?假设我想创建一个非常基本的Cuyonon英语甚至是英语到Cuyonon短语翻译器,我该从哪里开始?

2 个答案:

答案 0 :(得分:1)

您阅读了大约5,000页关于机器翻译科学的内容。谷歌使用统计机器翻译。他们用两种语言收集巨大的平行文本语料库。他们匹配句子(这种对齐问题不是微不足道),然后他们训练一个巨大的统计模型。如果您拥有所有数据,可以使用开源工具包来构建这些模型,但它们不会像Google那样工作。

例如,this

答案 1 :(得分:1)

我会请愿谷歌。如果您正在翻译原住民语言,则需要一个字符集。这可能不存在。这是我要开始的地方,除非有人有更好的主意吗?接下来,我将从一个Web服务器访问一个数据库(因为我是一个.NET开发人员,我担心这个工具用于人们的土地上使用的苹果掌上电脑的数量 - 另一个话题)并开始做balander最常用单词的单词翻译(不幸地来自Hollander - 给予没有灵魂的人的名字)。我同意关于所需语言机制的第一个答案,并且肯定会检查开源建模工具(或者如果它有意义的话,请查看专有工具包)。所需的工作量取决于你认识的人,以及你如何处理这个问题 - 我很想知道它是怎么回事 - 感谢!