加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

如何将.doc或.docx文件转换为.txt文件

发布时间:2020-12-15 04:52:25 所属栏目:Java 来源:网络整理
导读:我想知道如何通过 Java将Word .doc / .docx文件转换为文本文件.我知道有一个选项,我可以通过Word本身做到这一点,但我希望能够做到这样的事情: java DocConvert somedocfile.doc converted.txt 谢谢. 解决方法 如果您对处理Word文档文件的Java库感兴趣,可能
我想知道如何通过 Java将Word .doc / .docx文件转换为文本文件.我知道有一个选项,我可以通过Word本身做到这一点,但我希望能够做到这样的事情:

java DocConvert somedocfile.doc converted.txt

谢谢.

解决方法

如果您对处理Word文档文件的Java库感兴趣,可能需要查看例如 Apache POI.网站引用:

Why should I use Apache POI?

A major use of the Apache POI api is
for Text Extraction applications such
as web spiders,index builders,and
content management systems.

P.S.:另一方面,如果您只是在寻找转换实用程序,Stack Overflow可能不是最合适的地方.

编辑:如果您不想使用现有的库但是自己完成所有艰苦的工作,您会很高兴听到Microsoft已发布所需的文件格式规范. (Microsoft Open Specification Promise列出了可用的规范.只需谷歌搜索您感兴趣的任何一个.在您的情况下,您需要例如OLE2复合文件格式,Word 97二进制文件格式和Open XML格式.)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读