nutch OnlinCuster 结果集聚合分类插件
发布时间:2020-12-13 20:19:22 所属栏目:百科 来源:网络整理
导读:这个是我现在还没弄明白的东西。。先占个位。。 nutch1.2中自带了carrot2聚合分类插件,但是这方面的中文资料没找到很多,所以有点费解, 看carrot2官方列子感觉很强大,神马分类都能分,但是就是不知道在现在做的项目中如何应用,修改至我想达到的分类效果
这个是我现在还没弄明白的东西。。先占个位。。 nutch1.2中自带了carrot2聚合分类插件,但是这方面的中文资料没找到很多,所以有点费解, 看carrot2官方列子感觉很强大,神马分类都能分,但是就是不知道在现在做的项目中如何应用,修改至我想达到的分类效果 估计是缓存机制 nutch1.2在加载超过2页的数据的时候,只会先加载前2页的数据,后面的数据需要请求才能加载, 所以需要分类的结果集只能重新查一遍,把所有的结果集查到,只用于分类 然后遍历结果集,统计。。。。。。 暂时么办法,只好先用死办法做做了,以后再优化了。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |