加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

检查来自Java的5百万行文件的唯一行数据

发布时间:2020-12-15 05:06:26 所属栏目:Java 来源:网络整理
导读:我有一个大文件,一行中有ID | VALUE这样的行. 如果是ID重复,则必须忽略行. 如何有效地进行此检查? 添加: ID很长(8个字节).我需要一个使用最少内存的解决方案. 谢谢你的帮助.我能够增加堆空间并立即使用Set. 解决方法 无论如何,您必须将ID存储在某处以便检
我有一个大文件,一行中有ID | VALUE这样的行.

如果是ID重复,则必须忽略行.

如何有效地进行此检查?

添加:
ID很长(8个字节).我需要一个使用最少内存的解决方案.

谢谢你的帮助.我能够增加堆空间并立即使用Set.

解决方法

无论如何,您必须将ID存储在某处以便检测重复项.在这里,我将使用HashSet< String>及其包含方法.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读