在程序员编辑器中使用unicode / utf-8

时间:2012-08-14 03:06:35

标签: unicode utf-8 editor

有很多程序员编辑声称支持unicode / utf-8。我尝试了很多(UltraEdit,jedit,emedit),但没有一个告诉你如何将unicode字符实际输入文件。其中一些告诉您如何将默认文件编码更改为utf-8或如何选择对utf-8有良好支持的字体,而不是如何使用编辑器将utf-8输入到文件中。

Go语言(以及其他一些语言)支持utf-8,我喜欢将变量的实际utf-8符号替换为名称为omega的变量。我还没有找到程序员编辑器,但实际上它允许你这样做。

我发现的唯一可以让你如何输入unicode的编辑器/文字处理器是Microsoft Word。键入unicode,Alt + X和Word转换它。要获得希腊字母omega类型“03c9”,然后是Alt + X. UltraEdit会让你从网页上复制utf-8,但是他们的文档没有说明如何在文件中输入utf-8,以及他们的技术。支持人们也不知道。

这应该很简单,但似乎完全没有记录。是否有一些关键组合约定允许您将unicode输入到这些编辑器中,这些编辑器应该像Ctrl-F广泛用于搜索一样支持unicode?

感谢。

6 个答案:

答案 0 :(得分:2)

标准程序员的编辑器 vim (1)支持有限的Unicode输入,即使你的操作系统太破碎也不能这样做(还有吗?)?

只需输入^VuXXXX,其中XXXX正好代表四位十六进制数字。

这将允许您输入分配给Basic Multilingual Plane的~6%的Unicode。其余的都是禁止的。

这可以在较新版本中修复。

否则,只需使用鼠标。

答案 1 :(得分:2)

如果缺少编辑器,我会使用一些技巧:

  1. 使用Windows charmap.exe实用程序选择字符并粘贴到文档中。
  2. 安装输入法编辑器(IME)以使用特定语言编写。
  3. Windows ALT keycodes

答案 2 :(得分:2)

最好将键盘设置为在所有Windows应用程序中生成Unicode字符,而不是依赖单个应用程序的自定义输入功能IMO。

使用EnableHexNumpad feature,您可以使用Alt + numbad-plus,hexcode在Basic Multilingual Plane中键入任何字符。 (虽然没有小键盘的笔记本电脑可能没什么用处。)

或者如果您想要输入很多特定字符,请找一个允许您直接输入的键盘布局。例如,eurokb可能会覆盖它,或者您可以使用MSKLC创建自己的。

答案 3 :(得分:1)

老问题,但你可以在GNU Emacs或Vim中输入很多unicode

  • GNU Emacs:M-x set-input-method RET tex(或C-x RET C-\ tex)可让您输入\omega来生成ω

  • Vim:Vim digraphs 可以生成unicode;插入模式下的C-k w *为您提供ω。

答案 4 :(得分:0)

地精砸在了头上。 (S)他只是没有详细说明。 bobince多了一点。

我冒昧地猜测您是从事L14N或I18N的开发人员或测试人员。我还猜测您需要在这里或那里做的不仅仅是几个字符,否则您会对从另一个应用程序粘贴感到满意。因此,我将分享一些建议。 (注意:这里的“你”是指下一个要看这里的人。我敢肯定,现在的原始海报已经不在乎了。:-))

如果您使用的是Windows 10,请安装适当的键盘驱动程序,以便将所需的字符输入到任何应用程序中。我确定Linux支持同样的事情。

例如我在自学印地语(हिंदी),所以我安装了Windows的印地语(Devanangari)支持。我使用该支持在印地语中键入“印地语”,然后切换回美国英语以完成本文的其余部分。如果您需要的只是西欧语言中的带重音符号,则可以安装INTL英语支持,然后直接在español或français或其他任何类型中输入。

不要将输入Unicode字符视为在英文文本中输入某种特殊数据。这只是别人的语言。使用他们的键盘。输入他们的语言。

我正在编写一个抽认卡应用程序以帮助我学习。我正在使用北印度语键盘支持在Word,写字板,Excel和Visual Studio编辑器中键入字符。印地语键盘支持在所有这些应用中的工作方式都完全相同,因为我希望它在几乎所有支持Unicode的文本编辑器中都能正常工作。正如您在上面看到的,它也可以在Chrome中的简单文本编辑控件中使用。禁止复制和粘贴。不记得特殊代码。它与ctrl-F一样无处不在。

答案 5 :(得分:-1)

看起来程序员编辑器中的unicode支持(某些Microsoft产品除外)主要是只读的。他们可以使用unicode打开文件并显示字符,但在文件中键入unicode则是另一回事。如果你想在程序员编辑器中输入unicode,你可以从其他地方(网页或Microsoft Word或记事本)复制它并将其粘贴到编辑器中,但编辑人员难以输入unicode或不可能。

UltraEdit技术支持向我推荐this web page,这解释了很多。不幸的是,没有一种解决方案适用于UltraEdit。

Microsoft Word和Notepad支持unicode条目。键入unicode值,后跟Alt + X,然后转换十六进制并显示它。然后,您可以将其复制并粘贴到UltraEdit或其他程序员编辑器中。正如其他人所说,unicode支持取决于操作系统和编辑器中的支持。

让我对在源代码文件中使用unicode感兴趣的是Mark Summerfield的书“Programming in Go”。他包含一个使用unicode的示例.go文件。将unicode希腊字符用于变量名称而不是名为“omega”或“theta”的变量会很棒。

然而,在源代码中使用unicode是一个坏主意。在程序员编辑器中支持unicode很糟糕,开发人员必须将源代码文件保存或转换为utf-8而不是ASCII。开发人员的工具还没有准备好用unicode编写代码,无论这个想法听起来多么整洁。