在R Studio中读取日语字符

时间:2018-09-29 08:59:31

标签: r cjk

我有一个日语文本csv文件,由制表符分隔 它是使用python csv包以utf-8编写的 但是,当我使用如下命令在RStudio中将其导入时

A <- read.csv("reviews4.csv",sep="\t",header = F,encoding="UTF-8")

日语字符将显示如下:

<U+8AAC>明無<U+3057><U+306B><U+5185>容量<U.....

我认为它只能正确显示汉字部分。

我尝试编码=“ CP932” 它会显示: 隤祆<98><81><86>嗒<87><....

然后,我尝试了另一种方法:单击右下角的文件,然后选择“导入数据集” 然后发生了奇怪的事情: 当我选择“第一行作为名称”时,姓氏会正确显示日语 但是当我禁用它时,它显示不正确。

enter image description here 谁能帮助我正确导入日本csv? 非常感谢!

1 个答案:

答案 0 :(得分:1)

使用fileEncoding =“ UTF-8”而不是encoding =“ UTF-8”。