加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

随机访问大型XML文件

发布时间:2020-12-16 22:49:01 所属栏目:百科 来源:网络整理
导读:我有一组索引大型 XML文件(MediaWiki转储文件)的工具,并使用这些indeces随机访问存储在文件中的各个记录.它工作得非常好,但我正在使用字符串函数和/或正则表达式“解析”XML,而不是真正的XML解析器,如果创建文件的方式将来会改变,这是一个脆弱的解决方案. 一
我有一组索引大型 XML文件(MediaWiki转储文件)的工具,并使用这些indeces随机访问存储在文件中的各个记录.它工作得非常好,但我正在使用字符串函数和/或正则表达式“解析”XML,而不是真正的XML解析器,如果创建文件的方式将来会改变,这是一个脆弱的解决方案.

一些或大多数XML解析器有办法做这些事情吗?

(我的工具版本用C,Perl和Python编写.将整个文件解析为某种数据库或将它们映射到内存中都不是选项.)

UPDATE

以下是用于比较的粗略统计数据:我使用的文件大多每周发布一次,当前文件的大小为1,918,212,991字节.我的索引工具的C版本在我的上网本上花了几分钟,只需要为每个发布的新XML文件运行一次.我不常在另一个XML文件上使用相同的工具,该文件的当前大小为30,565,654,976字节,并且在2010年仅更新了8次.

解决方法

我认为您应该将这些数据存储在XML数据库(例如exists-DB)中,而不是创建自己的工具来完成XML数据库为您提供的一小部分内容.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读