使用自定义比较器

时间:2016-01-11 17:18:22

标签: java collections java-stream

如果我有以下列表:

List<String> list = Arrays.asList("hello", "world", "hello");

我应用以下内容(Java8):

list.stream().distinct().collect(Collectors.toString());

然后我会得到一个列表&#34;你好&#34;和&#34;世界&#34;。

但是,在我的情况下,我有一个类型的列表(来自外部api)我想要&#34;绕过&#34;等于方法,理想情况下是比较器,因为它没有涵盖我需要的东西。

假设这个类看起来像这样:

public class Point {
    float x;
    float y;
    //getters and setters omitted
}

在这种情况下,我想要将两个要点定义为相等的标准,例如(30,20)和(30.0001,19.999)。

自定义比较器可以做到这一点,但我发现没有API能够执行Java8 Stream中的distinct(),而是使用比较器(或类似的模式)。

有什么想法?我知道我可以编写这样的函数,但我更喜欢使用现有apis的优雅方式...我对外部库没有限制(如果他们有一个舒适的做法,guava,apache-commons等是受欢迎的我需要的是什么。

1 个答案:

答案 0 :(得分:4)

HashingStrategy是您正在寻找的概念。它是一个策略接口,允许您定义equals和hashcode的自定义实现。

public interface HashingStrategy<E>
{
    int computeHashCode(E object);
    boolean equals(E object1, E object2);
}

Streams不支持哈希策略,但Eclipse Collections支持哈希策略。它具有支持散列策略的集合和映射,以及采用散列策略的distinct()等方法的重载。

这对字符串很有用。例如,在这里我们可以如何让所有不同的字符串忽略大小写。

MutableList<String> strings = Lists.mutable.with("Hello", "world", "HELLO", "World");
assertThat(
    strings.distinct(HashingStrategies.fromFunction(String::toLowerCase)),
    is(equalTo(Lists.immutable.with("Hello", "world"))));

或者您可以手动编写散列策略以避免垃圾创建。

HashingStrategy<String> caseInsensitive = new HashingStrategy<String>()
{
    @Override
    public int computeHashCode(String string)
    {
        int hashCode = 0;
        for (int i = 0; i < string.length(); i++)
        {
            hashCode = 31 * hashCode + Character.toLowerCase(string.charAt(i));
        }
        return hashCode;
    }

    @Override
    public boolean equals(String string1, String string2)
    {
        return string1.equalsIgnoreCase(string2);
    }
};

assertThat(
    strings.distinct(caseInsensitive),
    is(equalTo(Lists.immutable.with("Hello", "world"))));

这也适用于Points,但前提是您可以将非重叠区域内的所有点分组以具有相同的哈希码。如果您使用定义的比较器在两个点足够接近时返回0,那么您可能会遇到传递性问题。例如,点A,B和C可以沿A线和C线下降,它们都接近B但彼此相距很远。不过,如果这对您来说是一个有用的概念,我们欢迎向API添加ListIterable.distinct(Comparator)的拉取请求。

注意:我是Eclipse Collections的提交者。