【发布时间】:2015-03-19 20:34:40
【问题描述】:
我有一个应用程序,可以从 pdf 文件中提取标题。应用程序应该使用的文档都具有或多或少连贯的结构和格式,事实上,判断文本块是否为粗体非常重要。最近我遇到了一堆文件,其中一些块在视觉上显得粗体,但在字体的字符串表示中没有“粗体”部分。以下 SO 线程 how can i get text formatting with iTextSharp 帮助我理解,还有另一种使文本显示为粗体的方法。但是,在我的情况下,调用 GetTextRenderMode() 也无济于事,因为它返回 0 就好像它是普通文本一样。那么有没有其他方法可以使文本显示为粗体,是否可以使用 iTextSharp 检测到它?
【问题讨论】:
-
请分享有问题的 PDF 以供分析。还有其他方法可以使字形显示为粗体,例如用微小的偏移进行双重打印。
-
单页,很好地了解了我所写的内容:dropbox.com/sh/thhbp3qy8hpybxe/AABJtS5UkXE32V_kBFu_uPQea?dl=0。有 2 个标题,显示为粗体,但字体名称如下“JOJJAH+TT116t00”,GetTextRenderMode() 对两者的所有部分都返回 0。
标签: pdf fonts itextsharp