regexp_replace字符串

时间:2016-02-24 17:21:26

标签: sql oracle regexp-replace

我正在使用regexp_replace标准化邮件地址,我遇到了一个我遇到问题的情况。

考虑以下两个地址及其结果:

  • 115 1/2 East 6th St - > 115 1/2 E 6th St
  • 818 East St - > 818 East St

在第二个地址中,“East”是街道的实际名称,而不是方向指示符。

对于我的查询,我试过了

SELECT
     regexp_replace(address, 'East[^ St]', 'E ')

但是这无法将第一个地址转换为正确的格式。

如何编写我的regexp_replace,以便在第一个地址中将单词East转换为'E',但在第二个地址中保留单词?

2 个答案:

答案 0 :(得分:2)

您当前的模式与文字文本East匹配,后跟任何非空格,St的单个字符。我假设您可能打算使用负向前瞻来确保“东”不会出现在“St”之前,但遗憾的是Oracle不支持负面前瞻。相反,您需要使REGEXP_REPLACE成为条件:

CASE
    WHEN address LIKE '%East%' AND address NOT LIKE '%East St%'
        THEN REGEXP_REPLACE(address, your_pattern, your_replacement)
    ELSE address
END

答案 1 :(得分:1)

这用REGEXP_REPLACE()回答了你的问题。它查找字符串' EAST'(不想捕获'east'是另一个单词的结尾的情况)后跟一个空格,一个或多个字符,另一个空格和字符串'St'在一个小组中被记住。如果找到,请将其替换为' E',然后替换为第二个记住的组(空格后跟一个或多个字符,后跟空格和'St'。这是必需的,因为它们被正则表达式“消耗”引擎从左向右移动分析字符串,所以你需要把它们放回去。注意我添加了一堆不同的测试格式(总是测试意外!):

SQL> with tbl(address) as (
     select '115 1/2 East 6th St'       from dual union
     select '115 1/2 NorthEast 6th St'  from dual union
     select '115 1/2 East 146th St'     from dual union
     select '115 1/2 East North 1st St' from dual union
     select '818 East Ave'              from dual union
     select '818 Woodward'              from dual union
     select '818 East St'               from dual
   )
   select regexp_replace(address, '( East)( .+ St)', ' E\2') new_addr
   from tbl;

NEW_ADDR
------------------------------------------------------------------------
115 1/2 E 146th St
115 1/2 E 6th St
115 1/2 E North 1st St
115 1/2 NorthEast 6th St
818 East Ave
818 East St
818 Woodward

7 rows selected.