我有一个包含单列数据的文件。它们很少需要转换为列作为标题。经过几次计算之后,我将数据框缩小如下:
In [9]: df.compute()
Out[9]:
*
0 140 Global Intel
1 1 Frequency
2 2 Currency
3 3 Currency Conversion
4 4 Market
5 5 Segmentation
6 6 Sector
是否可以使用dask本身将行转置为列并创建新的数据框? 任何帮助表示赞赏。
编辑: 转置后,我的最终数据帧应该是什么样子?
In [22]: df_final
Out[22]:
Empty DataFrame
Columns: [140 Global Intel, 1 Frequency, 2 Currency, 3 Currency Conversion, 4 Market, 5 Segmentation, 6 Sector]
Index: []
答案 0 :(得分:1)
您可以使用
从DataFrame df的列(在您的情况下为column='*'
)中创建一个空的DataFrame。
import pandas as pd
df_empty = pd.DataFrame(columns=df.compute()[[column]].T)
如果您打印df_empty
:
Empty DataFrame
Columns: [(140 Global Intel, 1 Frequency, 2 Currency, 3 Currency Conversion, 4 Market, 5 Segmentation, 6 Sector)]
Index: []
如果您想切换回Dask,请使用dd.from_pandas