【发布时间】:2012-02-26 22:14:53
【问题描述】:
我有一些 PDF,我正在尝试将它们包含的文本从 Acrobat Reader 剪切并粘贴到 HTML 表单中。似乎其中一些文件使用(我怀疑)unicode 进行文本编码,所以当我尝试粘贴到 HTML 表单(在 firefox 上)时,我得到的是带有十六进制字符而不是可读文本的小框。问题不在于 PDF 没有被 OCRed ——当我尝试在 Acrobat Pro 中这样做时,它说它不能,因为文件已经包含可呈现的文本。有什么办法可以解决这个问题吗?例如,我可以在表单中添加某种 javascript 来进行转换吗?
【问题讨论】: