【问题标题】:Create variants of a document with corresponding labels for AI training为 AI 训练创建带有相应标签的文档变体
【发布时间】:2018-07-09 09:11:27
【问题描述】:

我正在寻找以下问题的简单解决方案: 我必须创建文档的变体并将它们导出为图像。这可以通过 MS Word 邮件合并轻松完成,但我需要该文档中每个文本块的像素位置。输入图像和像素位置以进行 AI 训练。

目前我能想到几种方法:

  1. 将 MS Word Mail Merge 输出放入 OCR 并尝试通过将它们与原始文本源进行比较来识别文本块的位置。
  2. 使用 JS、Python 或 Visual Basic 之类的东西创建文档,并在插入时保存每个插入文本块的确切位置。
  3. 也许使用 Visual Basic for Word 从使用邮件合并功能创建的 MS Word XML 文件中提取文本位置。

变体 1 似乎过于复杂,因为它使用了某种逆向工程。此外,即使在完全可读的文档上使用 OCR 也总是会导致错误。

所以变体 2 或 3 看起来不错,但我不知道任何符合要求的库,而 Visual Basic for Word 对我来说绝对是新领域。

我希望我对问题的描述足够好。如果你想让我澄清一些事情,请告诉我。

我感谢每一个想法和帮助! :)

最好的问候 亨里克

【问题讨论】:

    标签: vba machine-learning ms-word


    【解决方案1】:

    好像有人已经不喜欢我的帖子了。在投票否决我之前,请告诉我如何改进..

    无论如何,我可能已经找到了实现变体 2 的方法。这个stackoverflow post 引用了一个扩展 Python 图像库的Github Gist。它提供了在图像上写入文本并设置文本框的最大宽度的功能。该函数还返回绘制文本框的最终宽度和高度。使用它,我将尝试实现一个创建文档图像和标签文件的算法。

    也许这也会帮助其他人寻找相同的东西。

    【讨论】:

      猜你喜欢
      • 2021-07-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-05-18
      • 2016-09-08
      • 2021-08-24
      • 2021-07-12
      • 2022-12-12
      相关资源
      最近更新 更多