将行值转换为多列-Dask

时间:2020-01-28 08:24:09

标签: dask dask-dataframe

我有一个包含单列数据的文件。它们很少需要转换为列作为标题。经过几次计算之后,我将数据框缩小如下:

In [9]: df.compute()
Out[9]:
                                    *
0                    140 Global Intel
1                         1 Frequency
2                          2 Currency
3               3 Currency Conversion
4                            4 Market
5                      5 Segmentation
6                            6 Sector

是否可以使用dask本身将行转置为列并创建新的数据框? 任何帮助表示赞赏。

编辑: 转置后,我的最终数据帧应该是什么样子?

In [22]: df_final
Out[22]:
Empty DataFrame
Columns: [140 Global Intel, 1 Frequency, 2 Currency, 3 Currency Conversion, 4 Market, 5 Segmentation, 6 Sector]
Index: []

1 个答案:

答案 0 :(得分:1)

您可以使用

从DataFrame df的列(在您的情况下为column='*')中创建一个空的DataFrame。
import pandas as pd
df_empty = pd.DataFrame(columns=df.compute()[[column]].T)

如果您打印df_empty

Empty DataFrame
Columns: [(140 Global Intel, 1 Frequency, 2 Currency, 3 Currency Conversion, 4 Market, 5 Segmentation, 6 Sector)]
Index: [] 

如果您想切换回Dask,请使用dd.from_pandas

相关问题