欧几里德距离的矢量化实现

时间:2018-06-03 15:46:40

标签: python numpy vectorization euclidean-distance

我正在尝试计算欧几里德距离的矢量化实现(使用内积在X和Y中的每个元素之间)。数据如下:

X = np.random.uniform(low=0, high=1, size=(10000, 5))
Y = np.random.uniform(low=0, high=1, size=(10000, 5))

我做的是:

euclidean_distances_vectorized = np.array(np.sqrt(np.sum(X**2, axis=1) - 2 * np.dot(X, Y.T) + np.sum(Y**2, axis=1)))

虽然这给出了“一些输出”但答案是错误的,因为每行仍然包含5个元素。

有谁知道我做错了什么?

1 个答案:

答案 0 :(得分:3)

如果我理解正确,应该这样做

np.linalg.norm(X - Y, axis=1)

einsum(沿第一轴的每个差异对的点积的平方根)

np.sqrt(np.einsum('ij,ij->i...', X - Y, X - Y))

如果你想要所有成对距离

from scipy.spatial.distance import cdist

cdist(X, Y)