根据this SO question中的一个答案,我得到了一句话:
require(readr)
myData <- read_csv("foo.txt.gz")
但这让我因某种原因丢失了数据。
我的第二列是此格式的时间列:9:30:00.244271971 此代码将其转换为:09:30:00,因此丢失了大量信息。
我该如何解决这个问题?有没有办法避免丢失这些信息?
答案 0 :(得分:1)
@jaySf评论结果完美无缺。所以这就是答案:
(我有5列,前四个是字符,最后一个是数字。)
cdef np.int64_t[:,:] perm = np.argsort(P, axis=1)
答案 1 :(得分:1)
您也可以始终使用fread()
中的data.table
。您可以从file参数执行任意shell命令来处理解压缩,并且默认情况下它也不会自动强制您的时间戳,因此您不应该有截断问题。小插图Convenience features of fread有一些很好的例子。
(奖励,它明显快于reader
,如果您在{{1}中使用多线程安装github的开发v1.10.5版本,绝对会将其击败。 }} \
fread