从R中的字符串中删除某些字符

时间:2013-03-02 03:08:34

标签: string r

我在R中有一个包含大量单词的字符串。查看字符串时,我收到大量文本,其中包含类似于以下内容的文本:

>docs

....

\u009cYes yes for ever for ever the boys cried in their ringing voices with softened faces

....

所以我想知道如何从字符串中删除这些\ u009字符(所有字符,其中一些字符略有不同)。我尝试过使用gsub(),但这对从字符串中删除内容无效。

2 个答案:

答案 0 :(得分:50)

这应该有效

gsub('\u009c','','\u009cYes yes for ever for ever the boys ')
"Yes yes for ever for ever the boys "

这里009c是unicode的十六进制数。您必须始终指定4个十六进制数字。 如果你有很多,一个解决方案是通过管道将它们分开:

gsub('\u009c|\u00F0','','\u009cYes yes \u00F0for ever for ever the boys and the girls')

"Yes yes for ever for ever the boys and the girls"

答案 1 :(得分:8)

尝试: gsub('\\$', '', '$5.00$')