正则表达式从电子邮件地址中查找姓名

时间:2016-09-18 19:50:21

标签: python regex web-scraping

在python中,我正在尝试创建一个算法,该算法将使用电子邮件地址中的字符并搜索页面以计算字符串是该人的实际名称的可能性。我写了一个正则表达式来抓取页面上的所有电子邮件,但后来我想写另一个来尝试从电子邮件中找到人名(因为它是一个子集或名称的某些字符组成)。

我正在使用:

 self.reEmail = re.compile(r"\b(?!(?:.\B)*(.)(?:\B.)*\1)[char]+\b", re.IGNORECASE)

然而,这给了我所有单个字符。

电子邮件:bjoel@email.edu

姓名:Billy Joel - 是我想要的。

然而,并不总是电子邮件的第一个字母是第一个名字......

0 个答案:

没有答案
相关问题