替换csv行/列中包含特定字符串的文本

时间:2017-06-16 18:52:04

标签: python string csv pandas dataframe

我无法删除 csv 行中的\ u和相关文本,这些文本不以这些特定字符开头,即; \Ú**。

代码:

# Removing \u*?
import pandas as pd
reader=pd.read_csv('string_HT.csv', error_bad_lines=False)
for index,row in reader.iterrows(): 
    if  ("\u","\u*?","*?\u") in row['Hashtags'] :
        row['Hashtags'] = " "         

reader.to_csv("string_HT2.csv", index=False)

示例输入df:

df=pd.DataFrame({"Hashtags" : ["#DefendTheLand", "#526f\u696d\u7d39\u4ecb", "#30ac\u30f3\u30c0\u30e0", "#leadership" ]})

示例输出:

{"Hashtags" : ["#DefendTheLand", " ", " ", "#leadership"]}

我知道有类似的问题已被问及我已经完成了大部分问题,并尝试实施其他用户提供的所有方法,但我仍然无法正确理解。帮助将不胜感激。

注意:

我已在原始文件中尝试使用此代码进行初始清理。

for index,row in df1.iterrows():
    df1['Hashtags'] =df1['Hashtags'].str.strip("u'  ',").str.strip("u'").str.strip("\u*?]").str.strip("u']").str.strip("',")

0 个答案:

没有答案
相关问题