用另一列中的值替换字符串的一部分

时间:2019-03-17 13:36:51

标签: python regex string pandas

pandas DataFrame包含一列,其中用大括号显示了描述和占位符:

descr                        replacement
This: {should be replaced}   with this

任务是将花括号中的文本替换为同一行中另一列的文本。不幸的是,它不如:

df["descr"] = df["descr"].str.replace(r"{*?}", df["replacement"])

~/anaconda3/lib/python3.6/site-packages/pandas/core/strings.py in replace(self, pat, repl, n, case, flags, regex)
   2532     def replace(self, pat, repl, n=-1, case=None, flags=0, regex=True):
   2533         result = str_replace(self._parent, pat, repl, n=n, case=case,
-> 2534                              flags=flags, regex=regex)
   2535         return self._wrap_result(result)
   2536 

~/anaconda3/lib/python3.6/site-packages/pandas/core/strings.py in str_replace(arr, pat, repl, n, case, flags, regex)
    548     # Check whether repl is valid (GH 13438, GH 15055)
    549     if not (is_string_like(repl) or callable(repl)):
--> 550         raise TypeError("repl must be a string or callable")
    551 
    552     is_compiled_re = is_re(pat)

TypeError: repl must be a string or callable

2 个答案:

答案 0 :(得分:4)

将列表理解与re.sub一起使用,尤其是在性能很重要的情况下:

import re

df['new'] = [re.sub(r"{.*?}", b, a) for a, b in zip(df['descr'], df['replacement'])]
print (df)
                        descr replacement              new
0  This: {should be replaced}   with this  This: with this
1                This: {data}         aaa        This: aaa

答案 1 :(得分:3)

您的代码正在使用Pandas.Series.str.replace(),并且期望两个字符串执行替换操作,但是第二个参数是Series。

  

Series.str.replace(pat,repl,n = -1,case = None,标志= 0,   regex = True)[源代码]

     

替换模式/正则表达式在   系列/索引和其他字符串。等效于str.replace()或   re.sub()。参数:

     

pat:字符串或已编译的正则表达式

     

repl:字符串或可调用   ...

您可以直接使用Pandas.Series.replace()方法对其进行纠正:

df = pd.DataFrame({'descr': ['This: {should be replaced}'],
                   'replacement': 'with this'
                  })
>> df["descr"].replace(r"{.+?}", df["replacement"], regex = True)
0    This: with this

观察:

我更改了您的正则表达式。