Question

根据this SO question中的一个答案，我得到了一句话：

require(readr)
myData <- read_csv("foo.txt.gz")

但这让我因某种原因丢失了数据。

我的第二列是此格式的时间列：9：30：00.244271971 此代码将其转换为：09：30：00，因此丢失了大量信息。

我该如何解决这个问题？有没有办法避免丢失这些信息？

Answer 1

@jaySf评论结果完美无缺。所以这就是答案：

（我有5列，前四个是字符，最后一个是数字。）

cdef np.int64_t[:,:] perm = np.argsort(P, axis=1)

Answer 2

您也可以始终使用fread()中的data.table。您可以从file参数执行任意shell命令来处理解压缩，并且默认情况下它也不会自动强制您的时间戳，因此您不应该有截断问题。小插图Convenience features of fread有一些很好的例子。

（奖励，它明显快于reader，如果您在{{1}中使用多线程安装github的开发v1.10.5版本，绝对会将其击败。 }} \

fread