【发布时间】:2012-11-21 18:31:59
【问题描述】:
我正在开发一个 C# 控制台应用程序,该应用程序设计用于编辑现有 PDF 文件中的文本样式,例如将文本样式更改为粗体或斜体或添加字体系列、更改文本颜色...
我使用了 iTextSharp 库,但遇到了以下问题:
- PDF 文档中的细空格被修剪。
- 从现有文档中提取文本时,文本样式将被完全忽略(我的意思是字体、粗体、斜体...)
- 从 PDF 文件中提取内容时不读取特殊格式的数学、图像和文本
是否有任何其他库,或有任何建议来编辑上述 PDF 文件?
【问题讨论】:
-
这样提取文本格式的文本会很困难,至于第一个任务和第三个任务,我可以建议你一个库Spire.PDF for .NET,它甚至可以读取PDF图像和文本特殊文本,例如从右到左书写的 Herbrew。但是,据我所知,它不支持提取带有字体、粗体等的文本。
-
似乎是一个有趣的工具,虽然它不是一个非开源工具,但我会试试看,谢谢@michelle
标签: c# pdf itextsharp edit