r data.table group by没有聚合
发布时间:2020-12-14 04:57:03 所属栏目:百科 来源:网络整理
导读:如何在R中获取数据表,只返回一组分组值,而不应用其他聚合函数?说我有: test-data.table(x=c(rep("a",2),rep("b",3)),y=1:5) 我只是想回来: ab 我用的时候: test[,by=x] 我回来了: x y1: a 12: a 23: b 34: b 45: b 5 当我这样做时: test[,x,by=x] 我回
如何在R中获取数据表,只返回一组分组值,而不应用其他聚合函数?说我有:
test<-data.table(x=c(rep("a",2),rep("b",3)),y=1:5) 我只是想回来: a b 我用的时候: test[,by=x] 我回来了: x y 1: a 1 2: a 2 3: b 3 4: b 4 5: b 5 当我这样做时: test[,x,by=x] 我回来了: x x 1: a a 2: b b 我知道我可以用: test[,.(unique(x))] 但这似乎不是正确的方法,除此之外,如果我想返回两列分组? 解决方法
我通过将unique()应用于data.table来实现这一点,data.table只包含我感兴趣的分组列的子集.将data.table传递给unique(),如下所示,将触发对unique.data.table()的调用,该调用对于两个或多个列同样适用于:
unique(test[,list(x)]) ## or unique(test[,with=FALSE]) # x # 1: a # 2: b ## Add another column to see that unique.data.table() works fine in that case as well test[,z:=c(1,1,2,2)] unique(test[,.(x,z)]) ## .() is data.table shorthand for list() # x z # 1: a 1 # 2: b 1 # 3: b 2 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |