计算文本文件中唯一单词的数量

时间:2015-10-20 01:12:40

标签: java arraylist

我有一个40 000 ish文本文件。 文本文件中的所有单词都保存在ArrayList中。

我想找到该文件中有多少个唯一单词并将该值返回给主类。 因此,如果有一个独特的单词,计数器就会上升一个。

我希望输出为

   Amount of unique words: 7000

我试过

       public int antallOrd() {
          Set<Ord> unik = new HashSet<Ord>(ordListe) ;
            for (Ord unikt : unik) {
            System.out.println(nokkel + ": " + Collections.frequency(ordListe, nokkel));
       }

但并不完全明白如何实现这个

的计数器

提前致谢

2 个答案:

答案 0 :(得分:4)

您不必遍历unik - 它是一个集合,并将该集合中的所有单词都删除了重复项。 unik的大小是您问题的答案。

答案 1 :(得分:0)

将单词放入java.util.Bag并打印包的大小()。

如果你想保留每个单词的数量,你也可以使用键入单词的Hashtable。