Question

假设我有一个简单的数据框

test_df <- data.frame(c(0,0,1,0,0,1,1,1,1,1),c(1,0,0,0,0,0,0,0,0,0))

我想得到哪一个数字（0或1）是每行的最大值。在我的示例1中，第一个向量（6次出现），0表示第二个向量（9次出现）。

我开始时：

> sapply(test_df,table)
  c.0..0..1..0..0..1..1..1..1..1. c.1..0..0..0..0..0..0..0..0..0.
0                               4                               9
1                               6                               1

到目前为止看起来很好。然后

> sapply((sapply(test_df,table)),max)
[1] 4 6 9 1

我迷路了，我是否松开了协会？ 1 - ＆gt; 6,0 - ＆gt; 9 我想要的是使用＆＃34;赢家＆＃34;：1,0，...

返回一个向量

1 for the first vector (6 occurrences)
0 for the second vector (9 occurrences)
...

Answer 1

我们可以apply使用MARGIN=1从max输出的每一行中提取sapply值。

frqCol <- sapply(test_df, table)
apply(frqCol, 1, max)
# 0 1 
# 9 6

或使用rowMaxs

中的matrixStats

library(matrixStats)
rowMaxs(frqCol)
#[1] 9 6

如果我们需要＆＃39; max＆＃39;每列的价值

apply(frqCol, 2, max)

和

colMaxs(frqCol)

使用新示例

test_df <- data.frame(v1= c(0,0,1,0,0,1,1,1,1,1),
                  v2= c(1,0,0,0,0,0,0,0,0,0),
                  v3= c(1,0,0,0,0,0,0,0,0,1)) 
frqCol <- sapply(test_df, table)
apply(frqCol, 2, max)
#v1 v2 v3 
#6  9  8 
colMaxs(frqCol)
#[1] 6 9 8

Answer 2

这可以在一个apply语句中完成。虽然，不清楚你是否想要每个行或列的最大出现次数，所以这两者（使用@akrun的清洁数据集），返回显示每个行/列的'获胜者'（1或0）的向量。

## Data
test_df <- data.frame(v1= c(0,0,1,0,0,1,1,1,1,1),
                      v2= c(1,0,0,0,0,0,0,0,0,0),
                      v3= c(1,0,0,0,0,0,0,0,0,1)) 
#    v1 v2 v3
# 1   0  1  1
# 2   0  0  0
# 3   1  0  0
# 4   0  0  0
# 5   0  0  0
# 6   1  0  0
# 7   1  0  0
# 8   1  0  0
# 9   1  0  0
# 10  1  0  1

## Solution - For each row
apply(test_df, 1, function(x) { sum(sum(x == 1) > sum(x == 0)) })

## Result
# [1] 1 0 0 0 0 0 0 0 0 1

## Solution - For each column
apply(test_df, 2, function(x) { sum(sum(x == 1) > sum(x == 0)) })

## Result 
# v1 v2 v3 
# 1  0  0

获取每行数据框中出现次数最多的值

2 个答案: