提问者:小点点

dplyr:group_by、子集和摘要


假设我有一个由多行组成的数据帧,如下所示:

df <- data.frame(Group = c(0,0,1,1,1,0),V1=c(0,0,0,4,5,7), V2=c(0,3,0,4,0,1))

  Group V1 V2
1     0  0  0
2     0  0  3
3     1  0  0
4     1  4  4
5     1  5  0
6     0  7  1

Group是二进制的,V1和V2具有零膨胀(许多观察值==0)我想对每列进行子集(依次)以删除0 obs,然后计算剩余数据的分位数。至关重要的是,我想仅删除给定变量的0,而不是删除整行,因为我想为下一列重置并再次子集。

我下面有分位数的代码。有什么方法可以偷偷输入子集函数,或者我需要不同的方法吗?

#Functions for quantiles
quant25 <- function(x) quantile(x, probs=0.25, na.rm=TRUE)
quant50 <- function(x) quantile(x, probs=0.50, na.rm=TRUE)  
quant75 <- function(x) quantile(x, probs=0.75, na.rm=TRUE)

#Grouped calls on these functions
group_by(df, Group) %>%
summarise_each(funs(quant25, quant50, quant75), V1, V2)

共1个答案

匿名用户

我想我已经为我的目的找到了这个:df[,2:3][df[,2:3]==0]