在VB.NET或C#中使用itextsharp dll阅读PDF内容
发布时间:2020-12-17 07:32:04 所属栏目:百科 来源:网络整理
导读:如何使用Pdfreader类读取带有itextsharp的PDF内容。我的PDF可以包括纯文本或文本的图像。 using iTextSharp.text.pdf;using iTextSharp.text.pdf.parser;using System.IO;public string ReadPdfFile(string fileName){ StringBuilder text = new StringBuild
如何使用Pdfreader类读取带有itextsharp的PDF内容。我的PDF可以包括纯文本或文本的图像。
using iTextSharp.text.pdf; using iTextSharp.text.pdf.parser; using System.IO; public string ReadPdfFile(string fileName) { StringBuilder text = new StringBuilder(); if (File.Exists(fileName)) { PdfReader pdfReader = new PdfReader(fileName); for (int page = 1; page <= pdfReader.NumberOfPages; page++) { ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy(); string currentText = PdfTextExtractor.GetTextFromPage(pdfReader,page,strategy); currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default,Encoding.UTF8,Encoding.Default.GetBytes(currentText))); text.Append(currentText); } pdfReader.Close(); } return text.ToString(); } (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |