加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

data.table聚合到列表列

发布时间:2020-12-13 20:08:34 所属栏目:百科 来源:网络整理
导读:我正在尝试聚合data.table中的数据以创建一个新列,该列是先前行的列表.通过示例更容易看到: dt - data.table(id = c(1,1,2,3,3),letter = c('a','a','b','c','a')) 我希望以这样的方式聚合它,结果应该是 id letter1: 1 a,a,b,c2: 2 a,c3: 3 b,a 直觉我试过
我正在尝试聚合data.table中的数据以创建一个新列,该列是先前行的列表.通过示例更容易看到:
dt <- data.table(id = c(1,1,2,3,3),letter = c('a','a','b','c','a'))

我希望以这样的方式聚合它,结果应该是

id  letter
1:  1 a,a,b,c
2:  2     a,c
3:  3   b,a

直觉我试过了

dt[,j = list(list(letter)),by = id]

但这不起作用.当我逐个案例时,奇怪的是,例如:

> dt[id == 1,by = id]

   id      V1
1:  1 a,c

结果很好……我觉得我错过了.SD某处或类似的东西……

任何人都能指出我正确的方向吗?

谢谢!

更新:行为DT [,list(list(.)),by =.]有时会导致R版本> = 3.1.0中的错误结果.现在,在 data.table v1.9.3的当前开发版本中,这已在 commit #1280中修复.从 NEWS:
  • DT[,by=.] returns correct results in R >=3.1.0 as well. The bug was due to recent (welcoming) changes in R v3.1.0 where list(.) does not result in a copy. Closes 07003.

通过此更新,我不再需要I().你可以这样做:DT [,by =.]和以前一样.

这似乎与已知的bug #5585类似.在您的情况下,我认为您可以使用

dt[,paste(letter,collapse=","),by = id]

解决你的问题.

正如@ilir所指出的,如果实际上需要获取列表(而不是显示的字符),您可以使用错误报告中建议的解决方法:

dt[,list(list(I(letter))),by = id]

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读