如何从字符串中删除重复的字符?

时间:2019-05-04 07:32:32

标签: python python-3.x

我正在尝试清除此数据框中的“名称”列。它具有重复的字符,所有字符都遵循相同的模式。请查看下面的图片以供参考。

Dataframe

3 个答案:

答案 0 :(得分:0)

重复名称字段,因此只需将字符串减半

x='namename'
x[:len(x)//2]
'name'

答案 1 :(得分:0)

您可以像这样提取每一行的字符串的后半部分:

df["name"]=df["name"].apply(lambda x:x[:int(len(x)/2)])

答案 2 :(得分:0)

您应该解决根本的问题,而不要这样做。

毫无防备,要做的就是将字符串缩短一半

import math

def half_str(name: str):
    return name[:math.ceil(len(name)/2)]

以下是您数据库中的一些示例:

print(half_str("John SmithJohn Smith")) # "John Smith"
print(half_str("Ty GoodenTyGooden")) # "Ty Gooden"