如何在Ruby程序中使用Unicode /朝鲜语字符?

时间:2015-06-16 23:43:10

标签: ruby

我在过去的两个小时里一直在谷歌搜索这里,并且有大量的StackOverflow帖子声称可以解决这个问题,而且其中没有一个帖子对我有用。我很困惑,非常沮丧。

我有一个包含韩文文本的文本文件。我只想将它读入我的Ruby 2.1程序并用它做一些事情。

但每当我读入该文件时,所有Unicode字符都会被R = [12,34,45, _Gxxx]等替换。

我已经用Google搜索了这个问题,建议是:

  • \u2713作为该计划的第一行。这没有任何改变。
  • 在字符串上调用# encoding: UTF-8。这没有任何改变。
  • 在字符串上调用encode('utf-8')。这没有任何改变。
  • force_encoding('utf-8')更改为' UTF-8'。这没有任何改变。

特别令人沮丧的是,我首先使用Ruby程序编写了原始文本文件。我从网页上取下文字并将其写入文件,韩文字符写得很好。我只是无法将文件中读回来。

1 个答案:

答案 0 :(得分:0)

您可以使用encoding File.read选项读取文件时设置编码:

correctly_encoded_text = File.read("my_korean_text.txt", encoding: "UTF-8")
相关问题