【发布时间】:2013-05-08 02:02:46
【问题描述】:
我想使用 Google 的 OCR 功能从我拥有的文档中的图像中提取单词。我知道我可以拉出每张图片,然后重新上传它们以提取文本或将其转换为 PDF,然后上传,但如果可能的话,我不想执行这些额外的步骤。
有什么想法吗?
【问题讨论】:
标签: google-docs google-drive-api
我想使用 Google 的 OCR 功能从我拥有的文档中的图像中提取单词。我知道我可以拉出每张图片,然后重新上传它们以提取文本或将其转换为 PDF,然后上传,但如果可能的话,我不想执行这些额外的步骤。
有什么想法吗?
【问题讨论】:
标签: google-docs google-drive-api
图片上传后,您无法对图片执行 OCR,因为 OCR 创建的是 Google Doc 而不是图片文件类型。相反,使用files.copy 创建文件的新副本并将ocr 设置为True。新创建的文件副本将执行 OCR。使用文件复制不会通过网络将文件数据拉下来,因此带宽使用量很小。
【讨论】: