如何序列化CSR矩阵

时间:2019-06-28 12:50:16

标签: python json serialization scipy sparse-matrix

我有一个csr_matrix对象是根据TfidfTransformer.transform计算的。我要序列化或反序列化:

tf_csrmtrix = TfidfTransformer.transform(data)
json.dumps(tf_csrmtrix)
TypeError: Object of type 'csr_matrix' is not JSON serializable

如何处理这种数据之王:企业社会责任矩阵?

1 个答案:

答案 0 :(得分:0)

如果二进制序列化格式可以解决问题,我建议使用pickle module

只需import pickle,然后在使用pickle.dumps的地方使用json.dumps(注意,这给出的是字节对象,而不是像json这样的字符串)

您应该能够写入文件,DB或通过某些套接字,然后再将其加载(使用pickle),以获得完全相同的对象