重复数据删除,不区分大小写

时间:2020-06-30 03:19:06

标签: stata

我一直都用这个

duplicates drop

照顾重复项。

但是,此命令认为“ Apple Computer”和“ apple computer”不同。但显然,它们是相同的。如何删除此类重复项?

1 个答案:

答案 0 :(得分:2)

不是。字符串与程序员不同,因为它们不相等,并且duplicates有权(确实已指示)区别对待它们。

您决定将大写和小写的区别视为无关紧要。因此,可以通过比较使用upper()lower()来使全部大写或小写的字符串来解决此示例。

此外,duplicates的帮助说明:

重复项是在所有值上具有相同值的观察值 如果未指定 varlist 或在指定的 varlist 上指定变量。

因此,duplicates drop删除观察值的所有变量都必须相同。

相关问题