【发布时间】:2012-12-21 13:42:55
【问题描述】:
我正在使用 Itext,我需要提取 PDF 中特定标题的字体颜色,您知道如何执行此操作吗?
【问题讨论】:
-
@PradeepSimha 像这样的简明问题并不需要提问者尝试过的东西,通常情况下。换句话说,在没有真正获得答案的情况下,OP 可以尝试的东西并不多。
-
答案取决于标题是如何添加到 PDF 中的。 iText 并不是真正为此类任务创建的。
-
@PradeepSimha 我尝试探索 TextRenderInfo 并成功提取了字体族并计算了大小,但是在文档中找不到颜色:(
-
@KlasLindbäck 你有这方面的文献吗?我只发现 cmets 说这很难,但我还没有找到原因,
-
@Guevara 我在 iText 邮件列表中看到了解释(可在 nabble.com 上找到)。从 pdf 中提取信息的主要问题是有很多方法可以构建相同的输出。 pdf 可能是许多图像,或者标题可以(理论上)由每个字母一个文本段组成。文本提取工具是相当新的,它是为了提取文本而创建的(因为这是作者需要的)。