我想知道,我们如何将字体转换为Unicode字体。我的母语是PDF文件,但这些文本是用特定的字体文件(ttf文件)编写的。所以我想将这些文本转换为Unicode字体。
那么如何将这些文本转换为Unicode。有没有免费的在线软件,或者我必须用任何语言编写任何软件代码。
我在PHP中尝试过但没有更有效。
答案 0 :(得分:3)
你的问题混合了几个基本概念(目前还不清楚你是否要转换 font 或 text 它写的),我建议你看一下在询问“那么我将如何做”之前进入字体技术。
使用Unicode编码的“普通”字体 。字体的“编码”描述了为给定字符代码输出字体内的哪个字符 image 。字体可以包含多种编码--MacRoman,Windows Western - 现在包括Unicode编码几乎是标准的。
如果没有从字符集到Unicode的转换,则不能使用不符合Unicode编码(或任何常见编码)的字体。
您的说明表明PDF中的字体可能是不合格的字体,因此您需要一个将其字符代码映射到Unicode值的表格。使用Google查看其他人是否在您面前执行此操作;如果没有,你将不得不自己创建表。
然而
由于您的文字来自PDF,因此您不能再依赖编码了!如果创建PDF,则执行该操作的软件可以自由地将字符移动到不同的位置 - 通常它会从原始文件创建子集字体,并且可以方便地重新分配字符代码。友好的PDF创建者也可能在PDF中包含他们自己的编码,但它不是必需的。如果缺少,并且您的字体是子集,则只有一个解决方案:您必须为该特定PDF 创建转换表。 不对使用“相同”字体的其他文档有任何用处,因为它很可能具有不同的子集。