加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

什么是Ruby on Rails的一个很好的PDF到HTML转换器?

发布时间:2020-12-16 20:08:02 所属栏目:百科 来源:网络整理
导读:我正在尝试将程序化PDF转换为 HTML.到目前为止,我一直在使用 pdftohtml,但我们的用户对结果不满意. 这就是我需要的: 我在使用Ruby on Rails,但在Unix上工作的任何工具都可以正常工作,因为我可以从命令行调用它.但当然,一个好的宝石或插件将是完美的. 我更喜
我正在尝试将程序化PDF转换为 HTML.到目前为止,我一直在使用 pdftohtml,但我们的用户对结果不满意.

这就是我需要的:

>我在使用Ruby on Rails,但在Unix上工作的任何工具都可以正常工作,因为我可以从命令行调用它.但当然,一个好的宝石或插件将是完美的.
>我更喜欢它是开源的
>它需要能够处理图像
>如果有需要的话可以放弃图像,这将是很好的
>需要稳定
>它需要返回html的布局靠近原来的pdf(我试过pdftohtml,结果不是很好的情况)

解决方法

这里有几个更多的替代pdftohtml / xpdf:

> Adob??e有一个免费的在线PDF到HTML或文本conversion service.可能需要一两分钟才能将文档恢复,但我怀疑这个选项会给你最好的结果.
>有一个pdf-reader红宝石宝石,可以让您访问PDF文件的内部.这将涉及到您的一些开发/扩展,但您可以使用它来解析PDF文件并生成漂亮的HTML.如果您知道用户提前转换的文件类型(例如,如果他们正在使用标准化表单),这可能比听起来更容易.
>如果您使用ghostscript(gem在这里找到)将PDF转换为另一种格式,您可能会有更多的选择.宝石可以从PDF文件生成图像(png,jpg等),但是您可能将最好的运气转换成PostScript文件,因为似乎有一个十亿“PostScript到[insert format here]”转换器.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读