Question

我有一个数据框，我想根据现有列创建一个新列，其值为非null。

现有列是小数，有些行是null。我想用整数创建一个新列。

我正在使用lambda，但一直遇到语法错误。谁能告诉我什么是错的？感谢

df['new'] =  df['old'].apply(lambda x: int(x) if x>=0)

我也尝试过：

df['new'] =  df['old'].apply(lambda x: int(x) if x.isnull == False)

和这一个：

df['new'] =  df['old'].apply(lambda x: x.astype(int) if x>=0)

语法错误指向最后一个右括号。

Answer 1

df['new'] =  df['old'].apply(lambda x: int(x) if x>=0)

您需要在三元运算符的末尾有一个else。

df['new'] =  df['old'].apply(lambda x: int(x) if x>=0 else 'Nope')

Answer 2

您遇到语法错误，因为您的lambda功能不正确。具体来说，if ... else ... conditional expression是错误的。条件表达式必须是

conditional_expression ::=  or_test [“if” or_test “else” expression]

您遗失了else部分。

我想提到的另一件事是转换数据类型的优雅方式是使用astype function。如果你想在某些条件下投射数据，你可以这样做：

new = df.loc[df.old>0].astype('int')

然后new将成为您需要的系列。

感谢。