加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

使用sed编辑PDF属性

发布时间:2020-12-14 02:13:40 所属栏目:Linux 来源:网络整理
导读:我正在尝试为blender开发一个 python脚本,以将渲染的图像序列输出到PDF.我正在使用 Imagemagick转换为PDF,该部分工作正常,但是,我希望缩略图预览也包含在PDF中. PDF格式对我来说有点混乱,但我找到了/ PageMode和/ UseThumbs标签以及如何将它们正确地插入到文
我正在尝试为blender开发一个 python脚本,以将渲染的图像序列输出到PDF.我正在使用 Imagemagick转换为PDF,该部分工作正常,但是,我希望缩略图预览也包含在PDF中.

PDF格式对我来说有点混乱,但我找到了/ PageMode和/ UseThumbs标签以及如何将它们正确地插入到文件中.我可以手动完成这项工作,效果非常好.但是我一直试图获得类似的结果,而不需要手动完成,毕竟我正在写一个脚本.以下是PDF中标题数据的示例摘录,其中添加了标记:

%PDF-1.3 
1 0 obj
<<
/Pages 2 0 R
/PageMode
/UseThumbs
/Type /Catalog
>>
endobj
2 0 obj
<<
/Type /Pages
/Kids [ 3 0 R 17 0 R 31 0 R ]
/Count 3
>>

我正在尝试使用sed在第4行和第5行根据需要插入标签,这也有效,但是当我打开PDF时,图像已损坏.加密地,当我将手动编辑的PDF(未损坏的PDF)与记事本中的sed编辑的PDF(已损坏的)进行比较时,我可以找到的文件没有区别.有一个不同的字符数,但我找不到差异的位置

我知道PDF有一个偏移的交叉引用表,但我觉得手工做它不会破坏任何东西似乎很奇怪,但用sed做它会造成腐败

我究竟做错了什么?

解决方法

你真的不想从sed这样做.有些PDF可能看起来像面向行的文本文件,但它们肯定不是.

由于您已经在使用Python,因此您可以使用Python库来完成此任务.

pdfrw将从纯Python中为您做到这一点.它将在PDF文件中啜饮,并使用您想要的任何更改重建它并正确设置文件偏移量.以下代码片段应将/ PageMode设置为PDF的/ Root字典中的/ UseThumbs:

    from pdfrw import PdfReader,PdfWriter,PdfName

    trailer = PdfReader('myfile.pdf')
    trailer.Root.PageMode = PdfName.UseThumbs
    PdfWriter().write('mynewfile.pdf',trailer)

免责声明:我是pdfrw作者.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读