加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

如何使用PDFrw在Python中从PDF中提取数据

发布时间:2020-12-20 12:08:34 所属栏目:Python 来源:网络整理
导读:我正在尝试使用PDFrw从某个PDF获取数据(比如说 HERE页右上角的那个).我使用PDFrw来做到这一点.我查看了他们提供的文档(我找不到太多)并查看了他们在git上发布的示例代码,但我似乎无法获得足够的信息来做我想做的事情.如何使用PDFrw制作一个简单的程序进入PDF
我正在尝试使用PDFrw从某个PDF获取数据(比如说 HERE页右上角的那个).我使用PDFrw来做到这一点.我查看了他们提供的文档(我找不到太多)并查看了他们在git上发布的示例代码,但我似乎无法获得足够的信息来做我想做的事情.如何使用PDFrw制作一个简单的程序进入PDF(或者如果有更好的那个,则进入另一个程序)并提取某段文本.我正在考虑将其转换为HTML …这会更容易吗?看看我上面提供的PDF作为一个例子,我想得到(让我们说)电压,这在PDF中是600瓦…我怎样才能以最简单的方式做到这一点?我找不到任何关于此的任何其他堆栈溢出问题,所以希望有人可以帮助以前使用它!

谢谢!

解决方法

我是pdfrw的作者,它并不是真的为此而设计的.你应该看看pdfminer.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读