在网上找了内容

下载了.net  后台读取pdf的值这个插件

引用在了项目中

.net  后台读取pdf的值

然后找到pdf中的位置 进行读取

  string pdfPath = Server.MapPath("~/ViewPatPdf.pdf");
                PDDocument doc = PDDocument.load(pdfPath);
                PDFTextStripper stripper = new PDFTextStripper();
                string txt = stripper.getText(doc);
                Response.Write(txt);

上面是第一种

 下面用itextsharp进行读取

下载itextsharp.dll进行引用

然后写方法

 public string ReadPdfFile(string fileName)
        {
            StringBuilder text = new StringBuilder();
            PdfReader pdfReader = new PdfReader(fileName);
            for (int page = 1; page <= pdfReader.NumberOfPages; page++)
            {
                ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                text.Append(currentText);
            }
            pdfReader.Close();
            return text.ToString();
        }

filename也是pdf的路径

然后就可以读取出来了

这个读取pdf上面的内容,纯粹的把pdf上面的内容进行读取

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-10-25
  • 2021-07-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-02-22
  • 2021-07-30
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-01-22
相关资源
相似解决方案