如何使用PDF内容节点使用iTextSharp为未标记的PDF添加可访问性标记?

时间:2017-02-24 15:23:30

标签: c# pdf itext accessibility

如何使用PDF内容节点使用iTextSharp为未标记的PDF添加辅助功能标记?

Per Can I fully tag a non tagged PDF using iTextSharp?,我知道与人类相比,我们无法获得完美的标记,或者将PDF标记为正在创建(最好的选项),但是如何获取PDF内容对象并只是做一个“尽力而为“语义标记以提高可读性?

我认为基本原则可以是从左到右,从上到下排序所有PDF内容对象,然后对文本节点说,按顺序创建简单的P标签,以便至少说出它们。如果有混合的表单对象,那么也标记它们。显然,如果它的所有路径和工件,你可以用它做的不多,但是很多PDF都有文本节点。我不能依靠Adobe Reader来确定阅读顺序。

例如,the content structure of a PDF是一个简单示例,其中包含可以标记的文本内容节点。我们无法控制源PDF生成,但需要通过添加页眉/页脚等来操作PDF,并希望将它们全部标记在一起。

我们如何通过iTextSharp实现这一目标?我们有商业版5.5.10.0版本。

例如,abcpdf有一个名为MakeAccessible的函数可以尝试这个并且工作得很好。但是,我们想要使用iTextSharp。

0 个答案:

没有答案