如何将Qualtrics csv文件导入到pandas数据框中?

时间:2014-04-04 19:42:34

标签: python csv pandas qualtrics

Qualtrics是一个相当受欢迎的调查平台。您可以将调查数据下载为CSV文件。有关Qualtrics CSV文件的一些怪癖:

  1. 以BOM字符开头
  2. 它们包含额外的一行信息来解释变量是什么
  3. 他们经常在列名中包含括号和句点。
  4. 我已经能够使用以下代码处理#1和#2:

    import pandas as pd
    df = pd.read_csv('qualtrics_survey.csv', skiprows=[1], encoding='utf-8-sig')
    

    我运行以下代码,我看到所有列的列表,包括括号和句点。

    list(df.columns.values)
    

    有一个名为turk.1的专栏。但是,我无法运行:

    df.turk.1
    

    我不确定加载文件的最佳方法是什么。我可以删除所有括号,并用破折号或其他东西替换句号。

1 个答案:

答案 0 :(得分:4)

您只需使用df['col']表示法而不是df.col来选择列。因此,这种表示法实际上是首选。

如果您不想这样,您也可以在读取数据后使用rename方法重命名列。您可以手动执行此操作:

df = df.rename(columns={'turk.1': 'other_name'})

或提供例如用下划线替换所有句号的函数:

df = df.rename(columns=lambda x: x.replace('.', '_'))