加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

如何为简单的Perl词典应用程序正确格式化纯文本数据?

发布时间:2020-12-15 21:44:59 所属栏目:大数据 来源:网络整理
导读:我有一个非常简单的字典应用程序,可以搜索和显示.它是使用Win32 :: GUI模块构建的.我将字典所需的所有纯文本数据放在__DATA__部分下.脚本本身非常小,但是__DATA__部分下的所有内容,其大小都达到了30 MB.为了与我的朋友分享工作,然后我使用具有最高压缩级别9
我有一个非常简单的字典应用程序,可以搜索和显示.它是使用Win32 :: GUI模块构建的.我将字典所需的所有纯文本数据放在__DATA__部分下.脚本本身非常小,但是__DATA__部分下的所有内容,其大小都达到了30 MB.为了与我的朋友分享工作,然后我使用具有最高压缩级别9的PAR :: Packer模块的PP实用程序将脚本打包到一个独立的可执行文件中,现在我有一个单文件字典应用程序大约17MB的大小.

但是,尽管我对单文件脚本的想法非常满意,但是在脚本的DATA部分下放置如此大量的文本数据并不合适.首先,当我尝试在Padre中打开脚本时(记事本没问题),我收到的错误是:

Can't open my script as the script is over the arbitrary file size limit which is currently 500000.

我的问题:

如果我将DATA部分下的所有内容移到单独的文本文件中,除了消除Padre的文件打开问题之外,它是否带给我额外的好处?

如果我这样做,我该怎么做才能减小单独文件的大小?拉链并在搜索和显示时解压缩?

人们通常如何格式化字典应用程序所需的文本数据?

有任何意见,想法或建议吗?总是如此谢谢:)

解决方法

If I do so,What should I do to reduce the size of the separate file? Zip it and uncompress it while doing search and display?

那么,这取决于你想减小尺寸的原因.如果要最大限度地减少磁盘空间的使用(这些天大部分时间都是奇怪的目标),那么zip / unzip就是最佳选择.

但是,如果目标是最小化内存使用,那么更好的方法是将字典数据拆分为更小的块(例如,由第一个字母索引),并且仅加载所需的块.

How do people normally format the text data needed for a dictionary application?

恕我直言,通常的方法就是上面提到的方法(分区和索引数据)的逻辑结束:使用后端数据库,它允许您只检索实际需要的数据.

在您的情况下,可能像SQLite或Berkley DB / DBM文件这样简单的东西应该没问题.

Does it bring me any extra benefits except for the eliminating of Padre’s file opening issue if I move everything under the DATA section to a separate text file?

这在某种程度上取决于您的使用情况……如果它是3人使用的永不改变的脚本,可能没有实际的好处.

通常,它会使维护变得更加容易(您可以单独更改字典和代码逻辑 – 想想病毒定义文件与防病毒可执行文件的实际情况).

如果你采用我上面提到的方法,它也会减少进程内存消耗.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读