加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

C#编程读取文档Doc,Docx,Pdf的内容

发布时间:2020-12-15 17:53:57 所属栏目:百科 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 Doc文档:Microsoft Word 14.0 Object Library (GAC对象,调用前需要安装word。安装的word版本不同,COM的版本号也会不同) Docx文档:Microsoft Word

以下代码由PHP站长网 52php.cn收集自互联网

现在PHP站长网小编把它分享给大家,仅供参考

Doc文档:Microsoft Word 14.0 Object Library (GAC对象,调用前需要安装word。安装的word版本不同,COM的版本号也会不同)
Docx文档:Microsoft Word 14.0 Object Library (GAC对象,调用前需要安装word。安装的word版本不同,COM的版本号也会不同)
Pdf文档:PDFBox
/*
     作者:GhostBear
 *   博客地址:Http://blog.csdn.net/ghostbear
 */
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.IO;
using System.Text.RegularExpressions;

using org.pdfbox.pdmodel;
using org.pdfbox.util;

using Microsoft.Office.Interop.Word;


namespace TestPdfReader
{
    class Program
    {
        static void Main(string[] args)
        {


            //PDF
            PDDocument doc = PDDocument.load(@"C:resume.pdf");
            PDFTextStripper pdfStripper = new PDFTextStripper();
            string text = pdfStripper.getText(doc);
            string result = text.Replace('t',' ').Replace('n',' ').Replace('r',' ').Replace(" ","");
            Console.WriteLine(result);


            //Doc,Docx
            object docPath = @"C:resume.doc";
            object docxPath = @"C:resume.docx";
            object missing=System.Reflection.Missing.Value;
            object readOnly=true;

            Application wordApp;
            wordApp = new Application();

            Document wordDoc = wordApp.Documents.Open(ref docPath,ref missing,ref readOnly,ref missing);
            string text2 = FilterString(wordDoc.Content.Text);

            wordDoc.Close(ref missing,ref missing);
            wordApp.Quit(ref missing,ref missing);
            Console.WriteLine(text2);


            Console.Read();
            
        }

        private static string FilterString(string input)
        {
            return Regex.Replace(input,@"(a|t|n|s+)","");
           
        }
    }
}

以上内容由PHP站长网【52php.cn】收集整理供大家参考研究

如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读