【问题标题】:is there a way to automate/script (eg perl) a tagged pdf file to see if it's pdf/ua compliant?有没有办法自动化/编写脚本(例如 perl)标记的 pdf 文件以查看它是否符合 pdf/ua 标准?
【发布时间】:2015-10-30 18:52:18
【问题描述】:

我们有一些生成 PDF 的工具。我们希望自动化一些测试以确保生成的 PDF 被标记 (PDF/UA) 并且标记是有效的。

有很多交互式检查器(acrobat、PDF Accessibility Checker (PAC) 等)。他们根据matterhorn protocol 在 PDF 中生成通过/失败的报告。我想自动生成这些类似的报告。

我最近发现了一个 perl 模块,PDF::API2,它可能很有前途,但大约 15 年前我只用 perl 编写了一些简单的测试。有没有人使用该模块进行标记的 pdf 检查,或者您是否使用不同的脚本语言来完成此操作?

【问题讨论】:

  • 看一下马特宏协议,它表明有很多测试需要人工交互/决策。对于这些,您可以帮助获取物品,但仅此而已。 OTOH,对于机器可测试的项目,现在应该有 Acrobat 的预检配置文件/检查。这将允许将预检配置文件放在一起,该配置文件可以变成一个液滴,它将创建报告,并允许分离文件通过和失败。您也可以联系 Callas Software。

标签: pdf accessibility


【解决方案1】:

Adobe Acrobat 中使用的技术(在其 Preflight 组件中)是由 callas 软件开发的(注意:我与这家公司密切相关)。 callas 还以 pdfaPilot 的名义开发了相同的技术,该技术存在于手动版本中,也存在于完全自动化该过程的命令行和 SDK 版本中。

但是!

正如 Max Wyss 在他对您的问题的评论中所述,PDF/UA 检查有两个部分。规范中的一些规则可以通过软件自动测试,但很多都不能。

举个例子,可以通过编程验证 PDF 文档中的所有文本是否都标记有一种语言。检查这些语言标签是否真的正确是另一回事。

pdfaPilot Desktop 实际上允许您自动检查可能的情况,然后允许您将 PDF/UA 文件转换为可视标记的 HTML,从而更容易验证文本的含义和结构是否正确。

换句话说,是的,这样的技术是存在的,但它永远不会 100% 完成。

【讨论】:

  • 标记和验证比语言更多。例如,标记为图像的图像也需要具有替代文本。计算机可以确定它是否存在,但只有人类才能确定文本是否准确地描述了图像。这与语言无关。您列出的工具并没有做所有事情,甚至没有完成与可访问性相关的所有事情。您的回答无效。
  • 先生,首先,我没有否决您的回答。我现在就做,只是为了说明一点。其次,在谈到限制是什么时,我写了这篇“举个例子”。所以是的,我知道不仅仅是语言。另外,也许如果您正确阅读了我的答案,您还将阅读此“有些……可以自动测试……,但其中很多不能”。恐怕我不能比这更清楚了。如果您对某人发布有关竞争产品的帖子感到生气,请直接与该人讨论,而不是留下不正确且坦率地说愚蠢的 cmets。
  • 我不在乎你是否反对我的答案,你的答案是无效的,因为它没有解决问题的中心原则 - 可访问性。
  • @unobf 作为一个公正的第三方,我必须说大卫的回答确实不完整(他在回答中承认这一点;要完整回答这个问题需要编写完整的规范),但大卫的回答是正确的。这也是一个比你更好的答案。像你这样的答案通常不会被社区接受。阅读How do I write a good answer?,上面写着为链接提供上下文。出于这个原因,我已投票删除你的答案。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-05-28
  • 1970-01-01
  • 2023-04-04
  • 1970-01-01
  • 1970-01-01
  • 2010-11-05
相关资源
最近更新 更多