index,Adj Close,Close,High,Low,Open,SMA_100,SMA_20,SMA_5,SMA_50,Volume,code,date_of_trade
0,2.8999999999999999,2.8999999999999999,2.9700000000000002,2.8300000000000001,2.9300000000000002,3.8003000000000009,3.2214999999999998,3.1319999999999992,3.0767999999999969,631100,1PG,2016-02-05 00:00:00
以上是我的档案。我想要做的是将所有十进制数限制为3位小数(如2.333)并写入另一个文件。我正在使用python来读取文件。无论如何在文件级别而不是在每个列级别执行此操作?如果需要在列级别完成,最好的方法是什么?
答案 0 :(得分:2)
您可以使用Python的csv
库,如下所示:
import csv
with open('input.csv', 'rb') as f_input, open('output.csv', 'wb') as f_output:
csv_input = csv.reader(f_input)
csv_output = csv.writer(f_output)
csv_output.writerow(next(csv_input)) # write header
for cols in csv_input:
for i in xrange(1, 10):
cols[i] = '{:.3f}'.format(float(cols[i]))
csv_output.writerow(cols)
这将为您提供如下输出文件:
index,Adj Close,Close,High,Low,Open,SMA_100,SMA_20,SMA_5,SMA_50,Volume,code,date_of_trade
0,2.900,2.900,2.970,2.830,2.930,3.800,3.221,3.132,3.077,631100,1PG,2016-02-05 00:00:00
答案 1 :(得分:1)
如果要进行正确的舍入,则必须读取每列并将其转换为整数。如果将其保留为字符串,最好的办法是将小数点后的数字截断为3位数。
要进行舍入,您应该使用anyMatch(...)
原语(请参阅here)。
如果截断足够,您仍然必须逐行读取文件并将输出写入新文件,但您可以使用正则表达式。从本质上讲,你想要做的是:
round
第一个解决方案是:
import re
for line in file:
newline = re.sub(r"(\d\.\d{3})(\d*)", r"\1", line)
print(newline, file=newfile)
第二个是这个:
index,Adj Close,Close,High,Low,Open,SMA_100,SMA_20,SMA_5,SMA_50,Volume,code,date_of_trade
0,2.9,2.9,2.97,2.83,2.93,3.8,3.221,3.132,3.0768,631100,1PG,2016-02-05 00:00:00