是否有ISO语言代码来指示混合语言文本?

时间:2011-11-28 17:42:47

标签: nlp iso

我检查过ISO 639-1 specs但找不到任何引用。我可以为我的数据库做些什么,但是如果有标准则很好奇。

更新2012-02-26:我最终在我的语言表中创建了一个特殊条目,其中带有星号(*)作为国家代码,我现在用它来表示没有单一语言的条目。

2 个答案:

答案 0 :(得分:2)

有一些precedence for using commas when storing multiple ISO language codes,但是对于数据库条目,另一个表在存储这样的元数据时可能是谨慎的(甚至数据本身连同它的语言代码,如果它可以在段落甚至句子中分区)等级)表示这种一对多的关系。

如果您指的是collation,并且您正在处理多种语言,那么最好将文本转换为数据库支持的Unicode字符集,并将多语言文本存储在该字符集中格式。

答案 1 :(得分:2)

ISO 639-2ISO 639-3为包含多种语言的文档保留了代码mul

顺便说一句,IETF BCP 47目前是关于语言代码使用的最权威的文件。

相关问题