加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

nutch OnlinCuster 结果集聚合分类插件

发布时间:2020-12-13 20:19:22 所属栏目:百科 来源:网络整理
导读:这个是我现在还没弄明白的东西。。先占个位。。 nutch1.2中自带了carrot2聚合分类插件,但是这方面的中文资料没找到很多,所以有点费解, 看carrot2官方列子感觉很强大,神马分类都能分,但是就是不知道在现在做的项目中如何应用,修改至我想达到的分类效果

这个是我现在还没弄明白的东西。。先占个位。。

nutch1.2中自带了carrot2聚合分类插件,但是这方面的中文资料没找到很多,所以有点费解,

看carrot2官方列子感觉很强大,神马分类都能分,但是就是不知道在现在做的项目中如何应用,修改至我想达到的分类效果

估计是缓存机制 nutch1.2在加载超过2页的数据的时候,只会先加载前2页的数据,后面的数据需要请求才能加载,

所以需要分类的结果集只能重新查一遍,把所有的结果集查到,只用于分类

然后遍历结果集,统计。。。。。。

暂时么办法,只好先用死办法做做了,以后再优化了。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读