如何在Java中维护唯一列表?

时间:2012-11-06 21:16:12

标签: java list distinct-values

如何在Java中创建唯一/不同对象列表(无重复项)?

现在我正在使用HashMap<String, Integer>执行此操作,因为密钥会被覆盖,因此最后我们可以获得唯一的HashMap.getKeySet()。但我确信应该有更好的方法来实现这一点,因为这里浪费了价值部分。

7 个答案:

答案 0 :(得分:136)

您可以使用Set实施:

来自JAVADoc的一些信息:

  

包含无重复元素的集合。更正式地说,集合不包含元素对e1和e2,使得e1.equals(e2)和至多一个null元素。正如其名称所暗示的,该界面对数学集抽象进行建模。

     

注意:如果将可变对象用作set元素,则必须非常小心。如果在对象是集合中的元素的同时以影响等于比较的方式更改对象的值,则不指定集合的​​行为。这种禁令的一个特例是,不允许集合将自己包含在一个元素中。

这些是实施:

  • HashSet

    该类为基本操作(添加,删除,包含和大小)提供恒定的时间性能,假设散列函数在桶之间正确地分散元素。迭代此集合需要的时间与HashSet实例的大小(元素数量)加上后备HashMap实例的“容量”(桶数)之和成比例。因此,如果迭代性能很重要,则不要将初始容量设置得太高(或负载因子太低)非常重要。

    当迭代HashSet时,生成元素的顺序未定义。

  • LinkedHashSet

    Set接口的哈希表和链表实现,具有可预测的迭代顺序。此实现与HashSet的不同之处在于它维护了一个贯穿其所有条目的双向链表。此链接列表定义迭代排序,即元素插入集合(插入顺序)的顺序。请注意,如果将元素重新插入到集合中,则不会影响插入顺序。 (如果s.contains(e)在调用之前立即返回true,则调用s.add(e)时,将元素e重新插入到集合中。)

    所以,上面代码的输出......

     Set<Integer> linkedHashSet = new LinkedHashSet<>();
     linkedHashSet.add(3);
     linkedHashSet.add(1);
     linkedHashSet.add(2);
    
     for (int i : linkedHashSet) {
         System.out.println(i);
     }
    

    ......必然是

    3
    1
    2
    
  • TreeSet

    此实现为基本操作(添加,删除和包含)提供有保证的log(n)时间成本。默认情况下,迭代时返回的元素按其“natural ordering”排序,因此上面的代码......

     Set<Integer> treeSet = new TreeSet<>();
     treeSet.add(3);
     treeSet.add(1);
     treeSet.add(2);
    
     for (int i : treeSet) {
         System.out.println(i);
     }
    

    ...将输出:

    1
    2
    3
    

    (您还可以将Comparator实例传递给TreeSet构造函数,使其按不同顺序对元素进行排序。)

    请注意,如果要正确实现Set接口,则由set维护的排序(无论是否提供显式比较器)必须与equals一致。 (有关与equals一致的精确定义,请参阅Comparable或Comparator。)这是因为Set接口是根据equals操作定义的,但TreeSet实例使用compareTo(或compare)方法执行所有元素比较,因此从集合的角度来看,通过这种方法被认为相等的元素是相等的。集合的行为即使其排序与equals不一致也是明确定义的;它只是没有遵守Set接口的一般合同。

答案 1 :(得分:10)

我想在这里澄清一些其他人提到的但没有明确说明的原始海报。当你说你想要一个唯一列表时,这就是有序集的定义。 Set Interface和List接口之间的一些其他关键差异是List允许您指定插入索引。那么,问题是你真的需要List接口(即与第三方库的兼容性等),还是你可以重新设计你的软件以使用Set接口?您还必须考虑使用界面执行的操作。按指数查找元素是否重要?你在集合中有多少元素?如果你有很多元素,订购重要吗?

如果你真的需要一个只有一个唯一约束的List,那么就有Apache Common Utils类org.apache.commons.collections.list.SetUniqueList,它将为你提供List接口和唯一约束。请注意,这会打破List接口。但是,如果您需要通过索引查找列表,您将从中获得更好的性能。如果你可以处理Set接口,并且你有一个较小的数据集,那么LinkedHashSet可能是一个很好的方法。它只取决于您的软件的设计和意图。

同样,每个系列都有一些优点和缺点。一些快速插入但读取速度慢,一些具有快速读取但插入速度慢等。使用集合文档花费大量时间来充分了解每个类和接口的更精细细节是有意义的。

答案 2 :(得分:9)

使用new HashSet<String> 一个例子:

import java.util.HashSet;
import java.util.Set;

public class MainClass {
  public static void main(String args[]) {
    String[] name1 = { "Amy", "Jose", "Jeremy", "Alice", "Patrick" };

    String[] name2 = { "Alan", "Amy", "Jeremy", "Helen", "Alexi" };

    String[] name3 = { "Adel", "Aaron", "Amy", "James", "Alice" };

    Set<String> letter = new HashSet<String>();

    for (int i = 0; i < name1.length; i++)
      letter.add(name1[i]);

    for (int j = 0; j < name2.length; j++)
      letter.add(name2[j]);

    for (int k = 0; k < name3.length; k++)
      letter.add(name3[k]);

    System.out.println(letter.size() + " letters must be sent to: " + letter);

  }
}

答案 3 :(得分:3)

您可以使用HashSet<String>来维护一组唯一对象。如果地图中的Integer值很重要,那么您可以使用地图的containsKey方法来测试您的密钥是否已经在地图中。

答案 4 :(得分:2)

HashSet<String>(或)任何Set实施都可以为您完成工作。 Set不允许重复。

这是HashSet的javadoc

答案 5 :(得分:2)

我不知道这有多有效,但是在简单的情况下对我有用。

List<int> uniqueNumbers = new ArrayList<>();

   public void AddNumberToList(int num)
    {
        if(!uniqueNumbers .contains(num)) {
            uniqueNumbers .add(num);
        }
    }

答案 6 :(得分:1)

您可能希望使用java.util.Set<E>接口的实现类之一,例如java.util.HashSet<String>集合类。

  

不包含重复元素的集合。更正式地说,集合不包含元素对e1和e2,使得e1.equals(e2)和至多一个null元素。正如其名称所暗示的,该界面模拟数学集抽象。