hive regexp_replace删除多个字符串

时间:2018-04-05 18:11:11

标签: hive

在我的数据中,我有包含特殊字符的字符串

&#39, & &quot, 

有没有办法使用regexp_replace来替换多个字符串。更好的方法是选择“test_column'如果有奇怪的字符(等等&)删除它们。在我的查询中,我正在使用

select regexp_replace(test_column, "(&#39)|(&)","'| &") as my_column

这不是我打算做的事情。在任何地方它都会找到奇怪的字符,用

替换它
'|&

有没有办法使用select语句捕获和更改所有这些,或者如何在多个字符串上正确使用regexp_replace。

1 个答案:

答案 0 :(得分:0)

您的替换字符串为'| &,因此所有内容都会被该字符串替换。

regexp_replace(string INITIAL_STRING, string PATTERN, string REPLACEMENT)

试试这个

select regexp_replace(test_column, "(&#39)|(&)|(&quot,)","") as my_column
相关问题