无障碍且机器可读

PDF/UA的新ISO标准第一次对排版文档的无障碍可用性标准进行了定义。对于所有用户来说,有一个让人忽略的事实,就是该标准能够同时实现内容的机器开发。

2013年是“Portable Document Format”(便携式文件格式,PDF)诞生20周年之时。其对便携性做出了非常突出的贡献。PDF在正确时使用时可确保文档的无更改输出,无论何种输出条件。

“Anything, anytime, anywhere”(任何事、任何时候、任何地点),任何输出状况下任意内容的出现都会对可视内容的一体化构成障碍。采用多个分栏构成的固定页面结构的说明书对于智能手机来说并不“智能”。PDF/UA根据显示环境可确保输出完美的文档,即便是用于打印输出。

无障碍的意义

除对便携性的要求外,互联网数字内容应用的不断增加推动所有人都参与到信息社会之中。特别是在多元化社会和人口老龄化的背景下以及社会融合的需求之下,没有人会由于身体方面的影响被排除在信息社会之外。基于技术文档的基本标准,无障碍性具有非常重要的影响:可访问性、简单性和用户导向性。另外还包括稳定性这一特征,即在不利条件下也应可靠运行的要求。

对可访问性的要求可通过在内容输出方面允许机器支持的数据结构来进行保证。此方面的关键因素则是辅助技术,例如屏幕阅读器,其可将无障碍文档的内容转换为语音,从而提供给盲人或视力障碍用户使用。

ISO标准作为基础

现在,PDF文档满足所有上述标准。PDF/UA,“Portable Document Format for Universal Accessibility”(通用可访问性便携式文件格式)适于访问所有文件。一年之前,针对无障碍PDF文档的全新ISO标准“ISO 14289-1.文献管理应用--可访问性电子文件增强格式,第1部分:ISO 32000-1(PDF/UA-1)的使用”已经发布。基于同样经过认证的PDF标准1.7(ISO 32000-1),该标准首次对无障碍PDF文件属性的强制性技术标准进行了特别定义。

自2013年7月起,该ISO标准在德语翻译的德国工业标准DIN中作为草案发布,但在日常实际应用方面并非属于指导性方针。该标准更多是作为无障碍PDF文档的认证编写、处理和检测的基础。

法律框架条件

针对关于无障碍网络文件(WCAG 2.0)国际化准则,德国对于电子文档的无障碍使用制定了《残疾人平等法》(BGG)和《无障碍信息技术规范》(BITV 2.0)的规范性文件。PDF/UA填补了现有文档的空白,即打印流程中产生的原始文档,或纸质文档回归电子化的产物。

技术要求

该标准的第24页对PDF文档无障碍使用认证的最低要求进行了说明。作为参考,特别是根据新ISO标准对PDF文档进行检测的工具开发人员必须遵守该要求。标准化的目标是在PDF文档的可视性范围之外构建逻辑文档结构,通过不可见的标记提供可视内容之外的附加信息。例如,与XHTML中的样式相同,对带有元数据信息的标题、列表和图片说明进行分类。

图1在Adobe Acrobat
屏幕中显示标记结构Markus Müller-Trabucchi

这些可检测的条件包括:

  • 对所有内容元素进行分类
  • 根据示意图通过语义标记进行强调
  • 按照逻辑阅读顺序对所有内容进行清晰、连续性的分类
  • 通过文件标题设定元数据索引
  • 所有内容元素的语言强调
  • 替代性文字描述,用于具有含义的可视内容

目前的应用

长期以来,由于统一质量标准规定的缺失,导致此前软件开发商对“Tagged PDF”的支持不足。仅Adobe FrameMaker从版本5开始支持结构化的PDF文档。今天,所有领先的排版程序均可输出带标签的PDF文档,但往往需要第三方解决方案的支持。

PDF/UA工具

制作

•    Adobe InDesign(从版本CS 5.5起)
•    axaio MadeToTag:InDesign-Plug-in,用于文档优化
•    Microsoft Word(从版本2007起)
•    xymedia axesPDF:Word-Plug-in,用于从Word直接输出PDF/UA
•    Adobe FrameMaker(所有版本)
•    其他可自动化的Frameworks(PDFlib、XSL-FO等)

检测

•    Adobe Acrobat(从版本XI起):用于制作、检测和修改PDF文档的先进工具
•    PDF Accessibility Checker:“Stiftung Zugang für alle”基金会的免费检测工具
•    Callas pdfGoHTML:免费可视化工具

需要特别强调的是从非结构化的工作流程中生成结构化和可验证的数据。由于采用基于模板的工作方式,通过Office应用可生成有效的PDF/UA文档,因为段落格式的分类以及正文的清晰结构足以确保一致性的文档结构。在Adobe Acrobat中可通过导航选项卡“Tags”(标记)显示和处理逻辑文档结构。该选项卡在首次使用时必须通过菜单激活。 这些标记在启用选项“制作带有标记的PDF”(在FrameMaker中为“Tagged PDF”)或沿用排版程序的格式名称时生成。根据PDF/UA规范,并不强制使用图1所示的标准化标记名称,但推荐使用,因为并非所有的屏幕阅读器可正确分析保存的标记含义。

在Acrobat XI中同样整合了检测该项文件特征的功能。完整的“无障碍性检测”会生成一个HTML格式的报告,该报告可在认证工作流程中或作为PDF文档的附件进行复制。文档语言的分配或个别可替代文字的缺失均可直接通过上下文菜单进行修改,操作非常简单。这样可对PDF文档进行手动后期编辑,例如在源文件缺失时,但通常较为昂贵,在排版程序中对文档结构进行谨慎准备时可以避免该操作。

我们极力推荐使用PDF Accessibility Checker(PDF可访问性检查器,简称:PAC)进行最终的检测。这是由“Stiftung Zugang für alle”提供的免费程序,版本2是全球首款根据PDF/UA标准检查文档一致性的工具。同样还可生成报告及预览。

图2通过PAC1.2进行无障碍性检测 <br-/>Screen Markus Müller-Trabucchi

图3通过PDFGoHTML在浏览器中显示逻辑文档结构
Screen Markus Müller-Trabucchi

未来的应用

今天,所有先进的标准工具都支持制作结构化的PDF文档–参见信息栏“PDF/UA工具”。经过完善的检测工具(例如PAC 2.0)在不久的将来也会应用在以流程为导向的工作流程中。这样,PDF/UA就可实现一种电子格式支持所有输出条件的愿景。通过对内容的结构化处理,即便是“非结构化”的生产条件,也可实现全新的应用,不依赖设备对文档进行处理。通过Acrobat Plug-in pdfGoHTML等免费工具,可了解技术上如何实现在小型化的终端设备上显示无障碍PDF文件,并针对设备进行优化——即通过PDF/UA提供的“Responsive Publishing”。