R studio:创建来自excel

时间:2018-08-27 22:02:49

标签: r statistics rstudio

  • 我有一个很大的excel电子表格,希望在R中进行分析
  • 电子表格包含四列:“年龄”,“性别”,“就业状况”,“工资”
  • 表看起来像这样 1 (就业= 1-9,失业=“空白单元格”)
  • 我想输出类似数据透视表的数据,使我能够按年龄和性别了解人的平均工资,但仅显示受雇人员的子集(不包括就业栏中的空白) < / li>

我是一名医学生,对R的使用不是很丰富!感谢任何帮助!

1 个答案:

答案 0 :(得分:0)

带有data.table:

# example data
N <- 25
df <- data.frame(
    age        = sample(18:65, N, TRUE),
    sex        = sample(1:2,   N, TRUE),
    employment = sample(1:10,  N, TRUE),
    wages      = sample(1:50,  N, TRUE)*10
)


# convert to data.table
library(data.table)
setDT(df)

# pivot
df[employment != "", .(avg_wages = mean(wages)), by=.(age, sex)]

要用英语解释“枢轴”部分:

  • 保留“就业”不为空的行
  • 创建一个名为“ avg_wages”的新变量,它是“工资”的平均值。
  • 但是我们用“年龄”和“性别”来表示工资的平均值