将文本(印度语 - 古吉拉特语)从word文档复制到网页文本区域

时间:2010-06-18 06:13:33

标签: php unicode unicode-string

我正在用印度语(古吉拉特语)开发一个网站。

我的问题如下:

我的客户希望他们能够从word文档中复制Gujarati文本并粘贴到文本区域。

但是当我从word doc复制文本并粘贴到文本区域时,它会转换为英文字母。

http://www.chanakyanipothi.com/gujchanakya/Gopika.ttf

以上是我正在使用的字体链接。

我可以为您提供演示代码,供您进行一些工作。

2 个答案:

答案 0 :(得分:4)

您应该将TextArea的字体设置为Gopika。

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Gopika Test</title>
<style>
textarea {
    font-family:"Gopika";
}
</style>
</head>
<body>
<form><textarea>asdasdioasd</textarea></form>
</body>
</html>

答案 1 :(得分:2)

无法复制,我可以在没有任何明显问题的情况下将印度paste粘贴在textareas上。问题可能是你实际上并没有使用印度字符而是使用英文字符,或者更可能是这个字在某种程度上使你感到困惑。

我建议你在这里粘贴textarea的代码,并可能上传word文件,或者类似的一个例子(不像我会理解它),所以我们可以尝试复制问题。

<强>更新

第一个测试场景,我粘贴了维基百科中的一些文字,其中包括印度文,文本在文本区域和发布后都正确显示。我假设您正在为我在图像上看到的内容进行一些测试: alt text http://img8.imageshack.us/img8/5140/gujaratitest12768464518.png

第二个测试场景,我复制了docx文件中的文本,当粘贴在textarea上时,它显示为英文字母。为什么?因为那些不是印度人物,所以他们是英文字符,看起来像印度人物。

意思是即使它们看起来像印度语,它们仍然与下面的cii代码相同,当翻译为textarea时,它们会失去“外观”。你应该尝试一些真正的印度文字。

例如,根据您使用的字体,字母“a”看起来会有所不同,实际上可能是一只鸟,一棵树,一个印度人或摩托车,我们关心的所有人,但如果复制和粘贴在某个地方只允许纯文本而不是字体文本我们仍然会看到字母'a',因为它总是ASCII字符97.要自己测试,请转到word文档并按 ALT + 97 键(然后放弃ALT)你实际上会输入字母“a”,无论它是否显示。

希望你理解。 除了你将textarea的字体设置为特定的字体外,真正的印度,中文或其他任何东西都能正常工作,看起来像它的字体 - .-

如果这不能说服你,如果你使用Cujarati字体所有不是英文的字符,让我们说一个实际引用英文的评论仍然会以Cujarati字体显示,因此绝对不会感觉到了。

最后但并非最不重要的是,打开角色地图,查看Cujarati地图,然后查看任何其他字体的地图。然后你可以看到角色实际上是相同的。 但我放弃试图说服那些不想看的人。