处理pandas数据帧的最有效方法是什么?

时间:2017-11-16 13:43:52

标签: python pandas dataframe

我知道这可能已经在某个地方问了,但我找不到问题/答案(也许是因为我是熊猫新手)。所以这就是:

如果我想从pandas数据框计算一个新列,我可以这样做:

df['col_b'] = df.col_a + 100

但我无法做到这样的事情:

df['col_c'] = str(df.col_a) + 'c'

我知道我可以使用apply()方法并传递lambda或函数。但是这对于大型数据集(一百万行)来说通常看起来非常慢,而且我无法访问索引值。是否有更好(更快)的方法来进行这种操作?

修改

我知道我提供了一个简单的字符串连接问题。但我对更复杂的情况(如日期时间操作)更通用的最佳实践感兴趣。

0 个答案:

没有答案