OFFICE 文档转换为html在线预览
OFFICE 文档在线预览方案很多:
今天,我们要用的方案是转换为html来预览。 技术方案:
测试环境: 1. office文档转pdf1.1 安装libreoffice
1.2 启动转换服务
1.3 文档转换网上一般介绍的都是使用JODConverter ,通过java来调用转换服务,其实还有一种替代方案,就是使用pyodconverter,python版本的转换脚本https://github.com/mirkonasato/pyodconverter/ 下载后,进行测试:
soffice 可以正常转换为pdf,但是中文显示为乱码 1.4 中文乱码问题修复google一下,乱码问题大概是字体缺失的问题,于是尝试将windows下的字体拷贝过去,复制windows下的字体到/usr/share/fonts下,然后刷新字体缓存
再重启转换服务,再次测试,已经OK了! 2.pdf转htmlpdf转html,使用国人开源的pdf2htmlex,一开始尝试通过源码编译安装,依赖组件太多,安装非常麻烦!感兴趣的可以执行编译安装,参见(https://github.com/coolwanglu/pdf2htmlEX/wiki/Building) 下面介绍简单安装方式: 2.1 通过apt安装
2.2 测试pdf2htmlex
可以看到,当前目录生成了xiaoshujiang.html 2.3 转换脚本写一个脚本,将两次转换放到一起,方便调用:
3. 测试3.1 word (doc.docx)测试
效果: 3.2 表格 (xls)测试
3.3 PPT (pptx)测试
4. 总结本文介绍了一种在服务端将office文档转换为html以方便预览的方法。 实际使用时,可以将生成好的html放到网站路径下,通过拦截器,设置访问权限。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |