大熊猫数据框中2列之间的模糊匹配

时间:2018-08-03 09:51:30

标签: python csv

我有一个Excel文件,其中包含由名称组成的两列。我需要比较两列(并排),并在另一列中给出模糊评分。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

您可以使用FuzzyWuzzy模块计算同一行中两个项目之间的模糊分数,然后遍历各行。或者,如果您的数据集很长,则可以将其向量化。上周,下面的链接使我感到困惑:https://marcobonzanini.com/2015/02/25/fuzzy-string-matching-in-python/