Java比较两个列表

时间:2010-05-04 00:34:48

标签: java list comparison hashmap

我有两个列表(不是java列表,你可以说两列)

例如

**List 1**            **Lists 2**
  milan                 hafil
  dingo                 iga
  iga                   dingo
  elpha                 binga
  hafil                 mike
  meat                  dingo
  milan
  elpha
  meat
  iga                   
  neeta.peeta    

我想要一个返回多少元素相同的方法。对于这个例子应该是 3,它应该返回列表和不同值的类似值。

如果是,我应该使用hashmap然后用什么方法来获取我的结果?

请帮忙

P.S:这不是学校作业:)所以如果你只是指导我就足够了

10 个答案:

答案 0 :(得分:151)

修改

这是两个版本。一个使用ArrayList,另一个使用HashSet

比较它们并从中创建自己的版本,直到获得所需内容。

这应足以涵盖:

  

P.S:这不是学校作业:)所以如果你只是指导我就足够了

你问题的一部分。

继续原来的回答:

您可以使用java.util.Collection和/或java.util.ArrayList

retainAll方法执行以下操作:

  

仅保留此集合中包含在指定集合中的元素

请参阅此示例:

import java.util.Collection;
import java.util.ArrayList;
import java.util.Arrays;

public class Repeated {
    public static void main( String  [] args ) {
        Collection listOne = new ArrayList(Arrays.asList("milan","dingo", "elpha", "hafil", "meat", "iga", "neeta.peeta"));
        Collection listTwo = new ArrayList(Arrays.asList("hafil", "iga", "binga", "mike", "dingo"));

        listOne.retainAll( listTwo );
        System.out.println( listOne );
    }
}

修改

对于第二部分(类似值),您可以使用removeAll方法:

  

删除指定集合中也包含的所有此集合的元素。

第二个版本还为您提供了相似的值和处理重复(通过丢弃它们)。

这次Collection可以是Set而不是List(区别在于,Set不允许重复值)

import java.util.Collection;
import java.util.HashSet;
import java.util.Arrays;

class Repeated {
      public static void main( String  [] args ) {

          Collection<String> listOne = Arrays.asList("milan","iga",
                                                    "dingo","iga",
                                                    "elpha","iga",
                                                    "hafil","iga",
                                                    "meat","iga", 
                                                    "neeta.peeta","iga");

          Collection<String> listTwo = Arrays.asList("hafil",
                                                     "iga",
                                                     "binga", 
                                                     "mike", 
                                                     "dingo","dingo","dingo");

          Collection<String> similar = new HashSet<String>( listOne );
          Collection<String> different = new HashSet<String>();
          different.addAll( listOne );
          different.addAll( listTwo );

          similar.retainAll( listTwo );
          different.removeAll( similar );

          System.out.printf("One:%s%nTwo:%s%nSimilar:%s%nDifferent:%s%n", listOne, listTwo, similar, different);
      }
}

输出:

$ java Repeated
One:[milan, iga, dingo, iga, elpha, iga, hafil, iga, meat, iga, neeta.peeta, iga]

Two:[hafil, iga, binga, mike, dingo, dingo, dingo]

Similar:[dingo, iga, hafil]

Different:[mike, binga, milan, meat, elpha, neeta.peeta]

如果它不能完全满足您的需求,它会给您一个良好的开端,因此您可以从这里开始处理。

读者的问题:您如何包含所有重复的值?

答案 1 :(得分:32)

您可以尝试intersection()中的subtract()CollectionUtils方法。

intersection()方法为您提供了一个包含常用元素的集合,subtract()方法为您提供了所有不常见的元素。

他们也应该照顾类似的元素

答案 2 :(得分:9)

这些是真的lists(有序,有重复),还是sets(无序,没有重复)?

因为如果是后者,那么您可以使用java.util.HashSet<E>,并使用方便的retainAll在预期的线性时间内执行此操作。

    List<String> list1 = Arrays.asList(
        "milan", "milan", "iga", "dingo", "milan"
    );
    List<String> list2 = Arrays.asList(
        "hafil", "milan", "dingo", "meat"
    );

    // intersection as set
    Set<String> intersect = new HashSet<String>(list1);
    intersect.retainAll(list2);
    System.out.println(intersect.size()); // prints "2"
    System.out.println(intersect); // prints "[milan, dingo]"

    // intersection/union as list
    List<String> intersectList = new ArrayList<String>();
    intersectList.addAll(list1);
    intersectList.addAll(list2);
    intersectList.retainAll(intersect);
    System.out.println(intersectList);
    // prints "[milan, milan, dingo, milan, milan, dingo]"

    // original lists are structurally unmodified
    System.out.println(list1); // prints "[milan, milan, iga, dingo, milan]"
    System.out.println(list2); // prints "[hafil, milan, dingo, meat]"

答案 3 :(得分:4)

使用java 8 removeIf

public int getSimilarItems(){
    List<String> one = Arrays.asList("milan", "dingo", "elpha", "hafil", "meat", "iga", "neeta.peeta");
    List<String> two = new ArrayList<>(Arrays.asList("hafil", "iga", "binga", "mike", "dingo")); //Cannot remove directly from array backed collection
    int initial = two.size();

    two.removeIf(one::contains);
    return initial - two.size();
}

答案 4 :(得分:2)

如果您正在寻找一种方便的方法来测试两个集合的相等性,您可以使用org.apache.commons.collections.CollectionUtils.isEqualCollection,它会比较两个集合而不管顺序如何。

答案 5 :(得分:1)

假设hash1hash2

List< String > sames = whatever
List< String > diffs = whatever

int count = 0;
for( String key : hash1.keySet() )
{
   if( hash2.containsKey( key ) ) 
   {
      sames.add( key );
   }
   else
   {
      diffs.add( key );
   }
}

//sames.size() contains the number of similar elements.

答案 6 :(得分:1)

我在List Compare找到了一个非常基本的List比较示例 此示例首先验证大小,然后检查另一个列表中特定元素的可用性。

答案 7 :(得分:1)

简单的解决方案:-

    List<String> list = new ArrayList<String>(Arrays.asList("a", "b", "d", "c"));
    List<String> list2 = new ArrayList<String>(Arrays.asList("b", "f", "c"));

    list.retainAll(list2);
    list2.removeAll(list);
    System.out.println("similiar " + list);
    System.out.println("different " + list2);

输出:-

similiar [b, c]
different [f]

答案 8 :(得分:0)

在所有方法中,我发现使用org.apache.commons.collections.CollectionUtils#isEqualCollection是最好的方法。原因如下-

  • 我不必声明任何其他列表/自己设置
  • 我没有更改输入列表
  • 这非常有效。它检查O(N)复杂度是否相等。

如果不可能将apache.commons.collections作为依赖项,由于效率高,我建议实施以下算法来检查列表是否相等。

答案 9 :(得分:-1)

public static boolean compareList(List ls1, List ls2){
    return ls1.containsAll(ls2) && ls1.size() == ls2.size() ? true :false;
     }

public static void main(String[] args) {

    ArrayList<String> one = new ArrayList<String>();
    one.add("one");
    one.add("two");
    one.add("six");

    ArrayList<String> two = new ArrayList<String>();
    two.add("one");
    two.add("six");
    two.add("two");

    System.out.println("Output1 :: " + compareList(one, two));

    two.add("ten");

    System.out.println("Output2 :: " + compareList(one, two));
  }