Numpy / Scipy - 向量的稀疏矩阵

时间:2014-06-26 21:12:47

标签: numpy scipy sparse-matrix

我有稀疏的CSR矩阵(来自两个稀疏矢量的乘积),我想将每个矩阵转换为平面矢量。实际上,我想避免使用任何密集表示或迭代索引。

到目前为止,唯一的解决方案是使用coo表示迭代非null元素:

import numpy
from scipy import sparse as sp
matrices = [sp.csr_matrix([[1,2],[3,4]])]*3
vectorSize = matrices[0].shape[0]*matrices[0].shape[1]
flatMatrixData = []
flatMatrixRows = []
flatMatrixCols = []
for i in range(len(matrices)):
    matrix = matrices[i].tocoo()
    flatMatrixData += matrix.data.tolist()
    flatMatrixRows += [i]*matrix.nnz
    flatMatrixCols += [r+c*2 for r,c in zip(matrix.row, matrix.col)]
flatMatrix = sp.coo_matrix((flatMatrixData,(flatMatrixRows, flatMatrixCols)), shape=(len(matrices), vectorSize), dtype=numpy.float64).tocsr()

确实不满意且不优雅。有没有人知道如何以有效的方式实现这一目标?

1 个答案:

答案 0 :(得分:2)

你的flatMatrix是(3,4);每一行是[1 3 2 4]。如果子矩阵为x,则该行为x.A.T.flatten()

F = sp.vstack([x.T.tolil().reshape((1,vectorSize)) for x in matrices])

F是相同的(dtype是int)。我必须将每个子矩阵转换为lil,因为csr尚未实现reshape(在我的sparse版本中)。我不知道其他格式是否有效。

理想情况下,sparse可以让你进行整个范围的numpy数组(或矩阵)操作,但它还没有。

鉴于此示例中的维度较小,我不会推测备选方案的速度。