如果条件匹配两个“ for循环”中的两个字符串

时间:2020-05-03 19:59:26

标签: python loops nlp similarity sentence-similarity

请检查下面的代码,我试图遍历两个数据框,并检查两个数据框的国家/地区名称是否相同。但是我一次又一次得到Na / NaN值错误,我不明白为什么?这两个数据集都没有Na / NaN值,但是尽管如此,我仍然遇到此错误。请帮忙! IF语句引发错误。 Country_name是字符串,例如美国,印度等。

for reviewer_id, row in data.iterrows():
    for reviewer_id, row1 in data1.iterrows():
        if data1['country_name'][row1] == data['country_name'][row]:
            similar=textdistance.Levenshtein(row.Fname_Username,row1.Fname_Username)
            data2['key1']= str(data['reviewer_id'])+'_'+str(data1['reviewer_id'])
            data2['Fname_Username']= str(data['Fname_Username'])+'_'+str(data1['Fname_Username'])
            data2['Similarity1']=similar

ValueError:无法使用包含NA / NaN值的向量建立索引

1 个答案:

答案 0 :(得分:1)

请仔细查看iterrows()的工作方式(例如here)。rowrow1已经是您要访问的行,您只需要获取其中的列,例如

if row1['country_name'] == row['country_name']:
相关问题