如何对包含空格的数据框列进行算术运算

时间:2018-08-31 20:19:06

标签: r arithmetic-expressions

我在这里有一个数据框,想创建一个新列,该列是一列除以另一列的商。

首先,我尝试过:

df$new_column_name <- df$dividend column / df$divisor column

以这种方式格式化时,出现错误:

  

“错误:df $ dividend列/ df $ divisor列中出现意外符号”

我也尝试过:

df$new_column_name <- df$"dividend column" / df$"divisor column"

在这里我得到错误:

  

“二进制运算符的非数字参数”

两个用于数学的列的名称中都有空格(如果有区别的话)。

1 个答案:

答案 0 :(得分:0)

正如joran在评论中提到的那样,在列名中实际上不建议使用空格。它会导致很多头痛。听起来好像您的列不是数字。您可以使用str查看所拥有的列的类型。下面是一个示例,其中提供了使用tidyverse软件包解决问题的可能解决方案,我强烈建议您检出该问题。

library(tidyverse)

# create data frame with space in column names
df <- data.frame("dividend column" = 1:5, "divisor column" = 6:10, check.names = FALSE)

# use str to get the classes of each column
str(df)
#> 'data.frame':    5 obs. of  2 variables:
#>  $ dividend column: int  1 2 3 4 5
#>  $ divisor column : int  6 7 8 9 10

# use set_tidy_names to replace space in column names with '.'
# change columns to numeric values
# use dplyr::mutate to create the new column
df <- set_tidy_names(df, syntactic = TRUE) %>% 
  mutate_at(vars(c("dividend.column", "divisor.column")), as.numeric) %>% 
  mutate(new_column_name = dividend.column/divisor.column)
#> New names:
#> dividend column -> dividend.column
#> divisor column -> divisor.column