Question

index,Adj Close,Close,High,Low,Open,SMA_100,SMA_20,SMA_5,SMA_50,Volume,code,date_of_trade
0,2.8999999999999999,2.8999999999999999,2.9700000000000002,2.8300000000000001,2.9300000000000002,3.8003000000000009,3.2214999999999998,3.1319999999999992,3.0767999999999969,631100,1PG,2016-02-05 00:00:00

以上是我的档案。我想要做的是将所有十进制数限制为3位小数（如2.333）并写入另一个文件。我正在使用python来读取文件。无论如何在文件级别而不是在每个列级别执行此操作？如果需要在列级别完成，最好的方法是什么？

Answer 1

您可以使用Python的csv库，如下所示：

import csv

with open('input.csv', 'rb') as f_input, open('output.csv', 'wb') as f_output:
    csv_input = csv.reader(f_input)
    csv_output = csv.writer(f_output)
    csv_output.writerow(next(csv_input))    # write header

    for cols in csv_input:
        for i in xrange(1, 10):
            cols[i] = '{:.3f}'.format(float(cols[i]))
        csv_output.writerow(cols)

这将为您提供如下输出文件：

index,Adj Close,Close,High,Low,Open,SMA_100,SMA_20,SMA_5,SMA_50,Volume,code,date_of_trade
0,2.900,2.900,2.970,2.830,2.930,3.800,3.221,3.132,3.077,631100,1PG,2016-02-05 00:00:00

Answer 2

如果要进行正确的舍入，则必须读取每列并将其转换为整数。如果将其保留为字符串，最好的办法是将小数点后的数字截断为3位数。

要进行舍入，您应该使用anyMatch(...)原语（请参阅here）。

如果截断足够，您仍然必须逐行读取文件并将输出写入新文件，但您可以使用正则表达式。从本质上讲，你想要做的是：

round

第一个解决方案是：

import re

for line in file:
    newline = re.sub(r"(\d\.\d{3})(\d*)", r"\1", line)
    print(newline, file=newfile)

第二个是这个：

index,Adj Close,Close,High,Low,Open,SMA_100,SMA_20,SMA_5,SMA_50,Volume,code,date_of_trade
 0,2.9,2.9,2.97,2.83,2.93,3.8,3.221,3.132,3.0768,631100,1PG,2016-02-05 00:00:00

格式为3位小数csv文件python中的所有十进制数

2 个答案: