按多个变量计数

时间:2016-01-19 16:48:09

标签: r summary

我有一个非常大的数据集,显示网站的登录信息。我正在尝试按用户名计算登录频率。

我希望获得的是一个如下表格,其中句点列为列标题,频率是行名称,数据是在给定日期登录的用户数量标题行,即

[weekday] [Mon][tue][etc]

[logins ] 

[      1][123][456][789]

[      2][987][654][321]

[    etc][123][456][789]

源数据只是登录ID,日期/时间登录。我已经能够根据登录日期添加附加月份,日期名称和日期编号的列。

理想情况下,我希望能够为每个类别(月,日,日名称)获得与上述相同的摘要。

library(lubridate ) 
library(dplyr) 
library(rpivotTable) 
df = data.frame(datasource) 

df$MonthNumber <- month(df$Date) 
df$DayNumber <- wday(df$Date, FALSE, FALSE) 
df$DayName <- wday(df$Date, TRUE, FALSE) 

#problem is here, i dont know how to get the count of user logins per day 
Results <- xtabs(~ DayCount + c(DayName,USERID), df) 
write.csv(Results, file="weekdata.csv") 
Results 

0 个答案:

没有答案
相关问题