r data.table group by没有聚合

发布时间：2020-12-14 04:57:03 所属栏目：百科来源：网络整理

导读：如何在R中获取数据表,只返回一组分组值,而不应用其他聚合函数？说我有： test-data.table(x=c(rep("a",2),rep("b",3)),y=1:5) 我只是想回来： ab 我用的时候： test[,by=x] 我回来了： x y1: a 12: a 23: b 34: b 45: b 5 当我这样做时： test[,x,by=x] 我回

如何在R中获取数据表,只返回一组分组值,而不应用其他聚合函数？说我有：

test<-data.table(x=c(rep("a",2),rep("b",3)),y=1:5)

我只是想回来：

a
b

我用的时候：

test[,by=x]

我回来了：

x y
1: a 1
2: a 2
3: b 3
4: b 4
5: b 5

当我这样做时：

test[,x,by=x]

我回来了：

x x
1: a a
2: b b

我知道我可以用：

test[,.(unique(x))]

但这似乎不是正确的方法,除此之外,如果我想返回两列分组？

解决方法

我通过将unique()应用于data.table来实现这一点,data.table只包含我感兴趣的分组列的子集.将data.table传递给unique(),如下所示,将触发对unique.data.table()的调用,该调用对于两个或多个列同样适用于：

unique(test[,list(x)])  ## or unique(test[,with=FALSE])
#    x
# 1: a
# 2: b

## Add another column to see that unique.data.table() works fine in that case as well 
test[,z:=c(1,1,2,2)]
unique(test[,.(x,z)])   ## .() is data.table shorthand for list()
#    x z
# 1: a 1
# 2: b 1
# 3: b 2

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!