加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

从Python中的PDF中提取带有字体详细信息(样式和大小)的文本

发布时间:2020-12-20 13:40:31 所属栏目:Python 来源:网络整理
导读:我期待从 Python中的PDF中提取文本及其字体详细信息(样式和大小). 我需要读取/解析文本内容并获取字体详细信息.请建议. 解决方法 有一个python库.请看一下PDFMiner. http://www.unixuser.org/~euske/python/pdfminer/index.html. pdftext.py为您提供从pdf中
我期待从 Python中的PDF中提取文本及其字体详细信息(样式和大小).

我需要读取/解析文本内容并获取字体详细信息.请建议.

解决方法

有一个python库.请看一下PDFMiner.

http://www.unixuser.org/~euske/python/pdfminer/index.html.

pdftext.py为您提供从pdf中提取的文本,它还为您提供其他信息,如字体和字体大小等.

你可以试试.

注意:不支持Python 3

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读