都2022年了,PDF文件的野望究竟是什么

1991年春,Adobe联合创始人John Warnock首次提出了一种完全独立的通用文档格式的计划,但遭到了质疑。一位评论家甚至称其为“我听过的最愚蠢的想法”。在当时,这并不是不合理的反馈。让文档在各个方面和任何设备上显示和打印相同的内容,以前已经尝试过很多次了。然而,沃诺克觉得这一次不同。在短短两年的时间里,一个被他异想天开地称为“卡米洛特”的系统从一个很酷的想法发展成一种真正的免费文件格式。1993年,PDF诞生了。25年后,可以说PDF比以往任何时候都更强大。在商业出版、印刷、文档共享、协作、存档等方面,PDF是主要的最终形式的电子文档格式。但是再过25年,也就是2043年,当PDF 50岁的时候,它会是什么样子呢?

  • 我们还会使用PDF吗?
  • PDF最初的价值主张会过时吗?
  • PDF需要哪些创新才能成长?
  • 在区块链的世界里,PDF的原始特性是更重要还是更不重要?
  • PDF能永远存在吗?

这些问题的答案在今年早些时候的2018年欧洲峰会PDF日闭幕小组讨论中就已经呈现在了麦克风上。PDF协会邀请PDFTron首席执行官Catherine Andersz分享她对PDF的未来的看法。

那么,PDFTron的观点是什么呢?它与那些想知道PDF有什么新方向和新特性的人有什么关系?

PDF的关键价值主张是否会过时?

虽然PDF可能会改变,但推动PDF成功的关键价值主张和基本目的可能永远不会过时。

例子吗?

PDF协会执行董事Duff Johnson分享的关键字搜索趋势证明,当竞争对手如epub在流行度上起伏不定时,PDF一直保持稳定增长。越来越多的人正在搜索PDF,并寻找将竞争对手的格式转换为PDF的方法。

与此同时,pdf文件在移动设备上仍然不是很酷,许多pdf文件在小屏幕上阅读并不方便。然而,自相矛盾的是,PDF在移动设备上的使用持续增长。

这些趋势表明PDF的核心价值主张是必要的:用户总是需要某种方式来“进入同一页面”,因此总是需要一种解决复杂文档共享和协作的方案。数据显示,PDF目前在这个领域占据主导地位。

做出任何预测,尤其是迄今为止的预测,都是困难的。但就我们今天所知,我们可以很确定地预测,25年后,PDF仍然会被使用,事实上,可能会被更广泛地使用。

随着数字世界的发展,随着尖端技术变得更容易获得,随着移动设备的使用变得更普遍,随着无纸化成为必然,PDF的重要性只会越来越大。

因此,也许真正的问题并不是PDF的键值支柱是否会过时,而是在我们试图满足未来用户需求并推动PDF的边界时,如何在键值支柱的基础上构建并保留它。

PDF在未来将扮演什么角色?

从现在开始的25年里,PDF很可能会扮演同样重要的角色和目的:作为一种廉价、简单、高效和可靠的视觉信息交换。

然而,“PDF已经长大了。它需要新的用例。它需要满足这些用例和用户的未来需求,以及我们接下来可能梦想做的事情,”Andersz在PDF Days Europe说。(你可以在下面观看她的完整演讲。)

“很多人都在讨论如何改进游戏格式并增加新功能。但我们真的需要这么做吗?我们真的需要把PDF格式变得更复杂吗?它能解决问题吗?事实可能并非如此。”

虽然我们可能需要进一步调整格式以适应未来的应用程序和用户,但改变PDF本身可能不是唯一的答案——或真正的改变游戏规则的方法。

自PDF诞生以来,文档技术突飞猛进。例如,压缩流、jbig2、jpeg2000等,它们都有助于使PDF更小、更轻量,更容易查看、编辑、注释和分享。

但是,正如晶体管尺寸不能进一步缩小,导致一些人宣布摩尔定律死亡,PDF压缩接近其理论极限。进一步的重大进展是不可能的。

此外,自1993年以来,核心规范中添加的大多数新特性,如Tagged PDF、GeoPDF、XFA表单、3D、JavaScript甚至XMP,都还处于小范围。

例如,任何人都可以创建带标签的PDF。但是,2003年之后创建的pdf文件中,只有不到六分之一带有标签。而且,给剩下的部分贴上标签是一项成本高昂、耗时的项目,许多组织可能不愿承担。

此外,目前只有不到百分之一的PDF文件分别符合PDF/ a和PDF/UA标准。

添加的一些新特性(比如XFA)后来甚至从标准中删除了。

因此,与其扩展核心的PDF ISO规范(已经超过700页),还不如等待数十亿个PDF文件服从命令,“下一步是帮助其他技术使用……pdf文件,”Andersz说。也许,“我们不需要修复PDF——它已经很好了。”

下一代PDF -机器学习和人工智能

当j·沃诺克(J. Warnock)首次提出Camelot项目时,他设想了一个“大大简化、更小”的完整PostScript页面描述语言版本,这个版本在1984年成为Adobe的旗舰产品。

正如沃诺克所说,IPS (Interchange PostScript)需要简洁和灵活,以便与尽可能多的系统一起工作。正如他在1991年所写的:

“正确的理解IPS的方法是将它与英语联系起来。世界上没有人知道所有的英语单词,但英语单词的一小部分和某些使用模式使人们能够持续地交流。”

然而,自从PDF诞生以来,它的新功能发展得比藤壶还快。与此同时,PDF页面描述(源于PostScript技术)已经非常稳定和成功。如果规范更薄并专注于其核心价值,那么这种格式很可能在今天更加流行。

那么,PDF在50岁时应该是什么样子呢?

如今,人们正在放弃自己的电影和音乐收藏,转而使用Netflix和Spotify等网络服务,普通用户不会关心他们正在使用的底层技术或格式。用户只是想要享受他们的体验——毫不费力且没有限制。

同样,在一个越来越无格式的未来,用户不必关心他们正在使用的文档格式。人们可能会认为,未来的用户甚至不知道他们正在使用PDF,而PDF将融入到网络平台和应用程序中,成为用户体验中不可观察的一部分,就像今天桌面计算机的控制台窗口一样。

在十年的时间里,PDF有机会“超越页面”,成为真正无处不在的。而且,通过支持PDF与新技术的集成,我们可以帮助它更快地到达需要的地方。

PDF中缺乏语义结构是目前该格式最大的优势之一,也是其最大的弱点之一,因为没有一种普遍接受的方式来理解文档结构(文档结构有如此多的类型和不同的复杂性级别)。

然而,将PDF从文件格式的最小公分母转换为PDF并不需要像改变围绕它的技术那样改变PDF。

人工智能和相关领域的改进无疑将在文档理解和PDF内容的重新利用方面发挥更大的作用,在可访问性、搜索引擎优化、数据分析等领域有重要的应用。可靠的回流将成为重点领域,使PDF文本大小和布局能够无缝地适应任何移动设备或浏览器。

最终,随着技术的发展,我们可以预期PDF将成为不同系统之间通用信息交换的可靠媒介,并且其可感知的弱点将逐渐消失。

区块链会干扰或增加PDF的功能吗?

现在区块链热潮正在消退,我们可以看到一些实际的商业应用崭露头角。

首先要知道几件事。虽然区块链非常适合跟踪有限事务数据,但它也面临技术限制。有限的网络处理能力限制了任何真正分散的数字账本在任何给定时间可以处理的数据量。

加密货币技术专家正在努力克服这些障碍。但尚不清楚它们能走多远。

在此期间,虽然区块链可能不会干扰PDF,但它可以很好地增加价值。

两个领域是文件管理和验证。您可以期待看到区块链用于帮助保护和跟踪PDF,类似于它在供应链管理中用于跟踪高价值资产的方式。

例如,成立于2015年的总部位于伦敦的Everledger公司声称,已经在其区块链上放置了超过200万颗钻石,该公司使用IBM的区块链跟踪服务来加密资产来源。

有了Everledger,每颗实体钻石都有自己的数字孪生,可以记录插入符号、颜色和激光刻录的序列号。这一数字拷贝被记录在一个不可变的云账本上,反过来又让买家放心,他们可以在不损害个人隐私或机密的情况下,对每颗钻石的质量和供应链过程达成共识。

同样,PDF Days Europe的Joris Schellens建议在区块链中签署文件,而不是将签名存储在PDF中。这不仅降低了想要添加数字签名或验证的开发人员的代码复杂性。同样的原则也可以用于简化文档工作流程,跟踪文档的位置、所有权等。

换句话说,区块链可以用来帮助跟踪和验证PDF,就像Everledger可以用来确保买家购买的不是赝品或冲突石一样。

底线

今天,PDF仅仅是一个页面。但是PDF可以超越页面。而且技术本身并不需要改变那么多。随着机器学习和人工智能取得关键进展,以及区块链等其他技术的发展,PDF将获得新的机会来克服其弱点,并释放其潜力,以满足终端用户和企业的未来需求。