Question

我有一个包含3列的表格。它在第2列和第3列上有重复。我需要选择pnly重复行（包含所有3列）。怎么做？请帮帮我。

var1 var2 var3

a a a b a a c a a d b b e c c

以上是表格结构。它有3个columsn var1，var2，var3。仅基于列var2和var3，我们必须假设它是重复记录。我们不应该在找到副本时考虑var1。对不起对齐。

我使用下面的查询来获取所有具有/不具有重复的行，但使用等级来标识重复记录。但我不能只获得重复的记录。

select var1,var2,var3,ROW_NUMBER() over(PARTITION BY var2,var3 order by var2,var3) as rnk from vart

除此之外，我如何在重复的条目中获得最高等级记录？感谢。

Answer 1

如果您想要所有具有重复项的行，您可以使用count(*) over()

select var1, var2, var3
from (
      select var1,
             var2,
             var3,
             count(*) over(partition by var2, var3) as dc
      from YourTable
     ) as T
where dc > 1

结果：

var1 var2 var3
---- ---- ----
a    a    a
b    a    a
c    a    a

如果您想要所有重复项，只需使用row_number() over()。

select var1, var2, var3
from (
      select var1,
             var2,
             var3,
             row_number() over(partition by var2, var3 order by var1) as rn
      from YourTable
     ) as T
where rn > 1

结果：

var1 var2 var3
---- ---- ----
b    a    a
c    a    a

Answer 2

select var1,var2,var3 from vart where (var2+'#'+var3) in 
(
   select var2+'#'+var3 from vart group by var2,var3 having count(var1) > 1
)

Answer 3

你的主要钥匙是什么？如果var1是，请尝试：

select var1
from vart
group by var2+var3
having count(*)>1

如果不是，请尝试：

select * from vart where pk in
(
    select pk
    from vart
    group by var2+var3
    having count(*)>1
)

Answer 4

使用您的查询，您可以使用CTE扩展它并执行您想要的操作

with cte as
(
select var1,var2,var3,ROW_NUMBER() over(PARTITION BY var2,var3 order by var2,var3) as rnk from vart
)
select * from cte where rnk > 1

这将列出所有“重复”行。

您也可以使用cte删除欺骗：

with cte as
(
select ROW_NUMBER() over(PARTITION BY var2,var3 order by var2,var3) as rnk from vart
)
delete from cte where rnk > 1

仅根据少数列选择重复记录

4 个答案: