【发布时间】:2016-04-22 14:49:32
【问题描述】:
我使用 itext 5.0.6 从给定的 PDF 中提取了文本。我将 TextExtractionStrategy 中的 renderText() 方法覆盖为 PDF 中的 getTexts,并将提取的信息存储在 StringBuilder 中。实际上我想附加提取的文本及其各自的字体信息。但是有些单词被分成了2个单词。请提供任何帮助。提前致谢!!
【问题讨论】:
-
请分享您的代码并举例说明问题所在以及您想要实现的目标