PC-DOS,MS-DOS,Windows多语言文本文件

时间:2019-04-29 14:55:56

标签: windows character-encoding dos codepages

据我所知,1987年发布了PC-DOS 3.3和MS-DOS 3.3,它们具有多个代码页(850、860、863、865)。

这是否意味着用户可以在一个文件中使用葡萄牙语(cp860)和北欧(cp865)符号编写文本?

或者就像每个操作系统一个代码页。例如,来自葡萄牙的PC-DOS只有860个代码页,用户只能使用该代码页中的符号,而来自斯堪的纳维亚的PC-DOS只有865个代码页。

关于Windows的相同问题。从哪个版本开始支持多语言文本文档?

2 个答案:

答案 0 :(得分:0)

DOS并不真正了解代码页。它们只是ASCII字符串(零或美元终止)。

代码页主要用于显示:更改代码页,它将更改字节码在屏幕上的打印方式。

您在这里描述的是一个常见的问题:在一个文本中混合编码。如果年龄足够大,您将在网络中记住很多此类问题。文本文件没有有关代码页的标签或元数据。如果混合使用,您将只看到根据活动代码页显示的字符。更改屏幕的代码页,您将获得新的字符解释。

答案 1 :(得分:0)

可以在自己的文件中做任何您想做的事情。它正在与他人交流如何阅读它的问题。

所以,不,不是真的。在一个文件中使用多个字符编码并将其称为文本文件会比它值得的麻烦更多。

操作系统的设置与文件内容没有直接关系。在系统之间(例如通过Internet)交换文件的程序可能使用对源字符编码和字符编码本地设置的理解,并进行有损转码。

除了25年前的Unicode出现以外,什么都没有改变,一个字符集中可用的脚本超出了您的想象。因此,理想情况下,如果有任何转码要完成,那就只能是UTF-8。

相关问题