如何将.doc或.docx文件转换为.txt文件
发布时间:2020-12-15 04:52:25 所属栏目:Java 来源:网络整理
导读:我想知道如何通过 Java将Word .doc / .docx文件转换为文本文件.我知道有一个选项,我可以通过Word本身做到这一点,但我希望能够做到这样的事情: java DocConvert somedocfile.doc converted.txt 谢谢. 解决方法 如果您对处理Word文档文件的Java库感兴趣,可能
我想知道如何通过
Java将Word .doc / .docx文件转换为文本文件.我知道有一个选项,我可以通过Word本身做到这一点,但我希望能够做到这样的事情:
java DocConvert somedocfile.doc converted.txt 谢谢. 解决方法
如果您对处理Word文档文件的Java库感兴趣,可能需要查看例如
Apache POI.网站引用:
P.S.:另一方面,如果您只是在寻找转换实用程序,Stack Overflow可能不是最合适的地方. 编辑:如果您不想使用现有的库但是自己完成所有艰苦的工作,您会很高兴听到Microsoft已发布所需的文件格式规范. (Microsoft Open Specification Promise列出了可用的规范.只需谷歌搜索您感兴趣的任何一个.在您的情况下,您需要例如OLE2复合文件格式,Word 97二进制文件格式和Open XML格式.) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |