加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c – 使用Tesseract的页面布局分析?

发布时间:2020-12-16 03:33:10 所属栏目:百科 来源:网络整理
导读:Tesseract 3能够执行页面布局分析.但是,我找不到任何示例代码或文档如何使用该库用于此目的.我希望有人在这里可以解释如何对图像执行布局分析,以及如何解析生成的数据. 解决方法 Tesseract可以给出一个页面模式参数(-psm),它可以具有以下值: 0 =仅定向和脚
Tesseract 3能够执行页面布局分析.但是,我找不到任何示例代码或文档如何使用该库用于此目的.我希望有人在这里可以解释如何对图像执行布局分析,以及如何解析生成的数据.

解决方法

Tesseract可以给出一个页面模式参数(-psm),它可以具有以下值:

> 0 =仅定向和脚本检测(OSD).
> 1 =自动页面分割与OSD.
> 2 =自动页面分割,但没有OSD或OCR
> 3 =全自动页面分割,但没有OSD. (默认)
> 4 =假设一列可变大小的文本.
> 5 =假设垂直对齐文本的单个统一块.
> 6 =假设单个统一的文本块.
> 7 =将图像视为单个文本行.
> 8 =将图像视为一个单词.
> 9 =将图像视为一个单一的单词.
> 10 =将图像视为单个字符.

例:

tesseract image.tif image.txt -l eng -psm 0

但是,我不确定是否可以在独立模式下使用布局分析.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读