熊猫:从csv文件中获取特定列

时间:2016-04-27 21:27:09

标签: python python-3.x csv pandas dataframe

我有以下示例.csv文件:

str_header  int_header
string_a       1
string_b       2
string_c       3

根据互联网上的解决方案,此代码:

import pandas as pd
data = pd.read_csv("z.csv", names=['int_header'])
print(data['int_header'])

只应将int_header列读入data。但是data,如上所述,实际上包含所有文件列。我正在使用Anaconda的Python发行版。怎么了?

1 个答案:

答案 0 :(得分:5)

试试这个:

data = pd.read_csv("z.csv", usecols=['int_header'])

假设您的CSV文件有,作为分隔符

说明:

Docs:

  

名称:类似数组,默认无

     

要使用的列名列表。如果是文件    不包含标题行,那么您应该显式传递header = None

     

usecols:类似数组,默认为无

     

返回列的子集。结果>更快的解析时间和更低的内存使用率。

文档有点令人困惑。

names - 用于命名(给出列名),特别是如果您没有标题行或想忽略/跳过它。

usecols - 仅用于选择“有趣”列