notepad ++正则表达式-在逗号前查找多行中的所有重复项

时间:2018-11-19 09:01:41

标签: regex notepad++

我正在寻找一种方法来查找文件中逗号前100行以上的所有重复项。

示例:

"Select * From table_test"

我希望能够在第一个逗号之前找到两次列出的“ sugarcane”。逗号后的任何内容都可以忽略,因为它们重复了几次。

不胜感激:)

编辑:为澄清起见,以上内容是文件的一个很小的部分,只有3,000多行。实际完整文件中的重复项远远超过甘蔗。

Id就像正则表达式一样,可以找到所有在逗号前重复的行。

EDIT2:更好的例子:

原始文件:

structureblock,STRUCTURE_BLOCK
structurevoid,STRUCTURE_VOID
sugar,SUGAR
sugarcane,SUGAR_CANE
reeds,SUGAR_CANE
scane,SUGAR_CANE
reed,SUGAR_CANE
sunflower,SUNFLOWER
sugarcane,SUNFLOWER
tallgrass,TALL_GRASS
tgrass,TALL_GRASS
longgrass,TALL_GRASS
wildgrass,TALL_GRASS
lgrass,TALL_GRASS
tallseagrass,TALL_SEAGRASS
tseagrass,TALL_SEAGRASS
lseagrass,TALL_SEAGRASS
terracotta,TERRACOTTA
hardclay,TERRACOTTA

在上面有两个骗子。甘蔗和糖。我想要找到那些骗子的方法。

1 个答案:

答案 0 :(得分:0)

您可以使用以下正则表达式:

^([^,]+),[\s\S]+?(?=\1)

选中Regex Demo

注意:使用脚本比尝试使用正则表达式更好。.解决方案:解析每一行,按逗号分隔,然后在列表中的逗号前添加单词。对于每一行,检查关键字是否存在于列表中并采取相应的操作

相关问题