等号后提取

时间:2016-08-10 10:05:42

标签: python regex pandas

刚刚在Juypter上启动了python pandas。我在试图获得等号后的值时遇到了困难。任何人都可以帮助我度过难关吗?

        Hi = 123456
        123456 (result i wish to get)

我目前的代码返回" = 123456 "。

        df['column'].str.extract("Hi+\W(.*)",expand= True)

1 个答案:

答案 0 :(得分:4)

您在符号+上使用了i量词,使其匹配1次或更多次,因此\WHi之后的空格匹配。

您可以使用

r"Hi *[^\w ] *(.*)"

其中:

  • Hi - 匹配Hi
  • * - 匹配0个或更多空格
  • [^\w ] - 除空格外的非字char
  • * - 匹配0个或更多空格
  • (.*) - 除了换行符之外的0 +字符,尽可能多(字符的其余部分)。

如果Hi之后的空格必须,请使用+量词r"Hi +[^\w ] *(.*)"

但是,最好的方法是仅使用拆分:'Hi = 123456'.split(' = ')demo