linux – 如何使用多个线程进行zlib压缩(相同的输入源)
我的目标是在并行线程中压缩相同源的数据.
我已经定义了列表中的作业,这些作业具有读取信息(每个作业中500kb-1MB). 我的压缩器线程将使用ZLIB压缩每个块的数据并将其存储在相应作业的outbuf中. 现在,我想合并所有这些并创建一个标准ZLIB格式的输出文件. 从ZLIB RFC和浏览了pigzee的来源后,我明白了 ZLIB标题如下所示 +---+---+ |CMF|FLG| (2 bytes) +---+---+ +---+---+---+---+ | DICTID | (4 bytes. Present only when FLG.FDICT is set) +---+---+---+---+ +=====================+ |...compressed data...| (variable size of data) +=====================+ +---+---+---+---+ | ADLER32 | (4 bytes of variable data) +---+---+---+---+ 就我而言,也没有字典. 所以当我组合两个压缩单元时,所有单元的标题都是相同的. 因此,我正在做以下的操作. >对于第一个单元,我正在编写标头压缩数据. 但问题是,我在deflate期间收到错误,说某些地方的数据无效. 有人已经尝试过这样的事吗?任何相关信息都会非常有用. 解决方法
您不能简单地连接原始deflate数据流.每个放气流都是自终止的,因此解压缩将在第一个流的末尾结束.
您需要更仔细地查看pigz代码以了解如何合并deflate流.您可以使用Z_SYNC_FLUSH完成最后一个块并将其带到字节边界而不结束deflate流.然后,您可以完成放气流,并剥离标记为结束块的最后一个空块.除了应该正常终止的最后一个deflate流.然后,您可以连接一系列n-1个未终止的deflate流和最后一个终止的deflate流. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |