根据另一列中的阈值汇总一列

时间:2020-08-23 17:58:52

标签: r

这是我的第一个导致堆栈溢出的帖子,所以让我知道我是否做错了!

试图在R studio中做到这一点。

我有一个数据框,仅当Image_number值> 250 时,我才想基于Row,Col和Prion列的分组来对size_adjusted列求和。

See my dataframe, (Sorry couldn't figure out how to format it nicely in the message

我已经成功使用了以下内容(在Image_number列中没有此条件)。

Threshold <- mydataframe %>% group_by(Row, Col, Prion) %>% summarise(AUC, sum(size_adjusted))

我该如何设置条件?我尝试使用“ if”功能,但收到错误。

谢谢大家!

最好

亚历克斯

1 个答案:

答案 0 :(得分:0)

有多种方法可以实现,这应该很容易,我们创建了一个逻辑向量,如下所示:

condition = mydataframe$Image_number >250

接下来,我们只需插入条件向量就好像它是一个索引一样:

mydataframe[condition,] %>% 
  group_by(Row, Col, Prion) %>% 
    summarise(AUC, sum(size_adjusted))

也可以只避开第一步,并在其中写下您的条件:

    mydataframe[mydataframe$Image_number >250,] %>% 
     group_by(Row, Col, Prion) %>% 
      summarise(AUC, sum(size_adjusted))