news 2026/6/17 19:17:21

AI原生文档格式DocLang开发引关注,能否解决人工智能文档处理难题?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI原生文档格式DocLang开发引关注,能否解决人工智能文档处理难题?

AI原生文档格式DocLang开发引发疑问

AI原生文档格式DocLang的开发引发了人们对其对人类工作者以及治理和问责制影响的疑问。来源:Shutterstock

DocLang工作组的目标与参与方

人工智能在理解为人类设计的文档时面临困难,DocLang工作组试图通过其为“从头为大语言模型(LLM)分词器构建”的机器可读商业文档规范来扭转这种不平衡。该工作组由IBM、英伟达(Nvidia)和红帽(Red Hat)共同创立,由Linux基金会的LF AI & Data项目主办,旨在创建一种开放、通用的AI原生文档格式,以改进企业为AI系统准备、交换和管理文档数据的方式。ABBYY和Human Signal也将参与其开发,同时欢迎其他贡献者加入。

现有文档格式的问题

该组织在发布声明中表示:“如今,企业在碎片化的文档格式环境中开展工作,包括PDF、JPEG等主要为人类阅读而非AI解读设计的文件类型。”随着组织越来越依赖生成式AI和智能代理系统,这种脱节在从商业文档中提取信息时会增加复杂性、提高成本并降低可靠性。

DocLang规范工作组的目标与特点

LF AI & Data执行董事马克·科利尔(Mark Collier)表示,DocLang规范工作组的目标是“开发一种与供应商无关、可互操作的标准,帮助组织更可靠、透明且大规模地为AI准备文档数据”。DocLang为任何类型的文档定义了一种结构化、机器可读的格式,就像数据领域的JSON一样,任何工具都可以实现,任何流程都可以使用。它基于DocLing构建,DocLing是LF AI & Data托管的一个文档处理工具包,可以将人类可读的PDF、文字处理文档或电子表格转换为结构化数据。

人工智能需要标准的演进

独立技术分析师卡米·利维(Carmi Levy)表示,类似DocLang的标准是必要的。他解释道:“现有的文档标准在过去几十年里出色地让全球利益相关者能够放心地进行协作,但随着AI重塑工作方式的规则,越来越明显的是,它们急需更新。”他指出,大部分静态的文档类型“在AI重新定义‘文档’这个概念时会有一定的局限性。在很多方面,AI时代的文档比以往更加迭代和动态,其定义需要与时俱进。我们目前使用的文档并非为AI时代设计。”

利维表示,在这种背景下,“DocLang代表了为文档标准建立某种基础基线的早期且充满希望的尝试,有望实现比当前更智能、更高效、风险更低的工作流程”。他还说,采用开源、与供应商无关的方法可以确保集体利益优先于特定供应商的需求,并补充道:“早期在网络、文档、网络和云计算方面的标准制定工作推动了定义现代生活的自由流动数字环境的发展。”利维认为,以AI为中心的文档标准将把这一现实带入下一代技术。

治理问题

Moor Insights & Strategy首席分析师杰森·安德森(Jason Andersen)表示,大语言模型的整个概念“涉及使用人类自然语言。计算机应该在我们不改变语法或语言的情况下理解我们。就像如今在搜索引擎优化(SEO)和更高级的编程语言中,我们被迫使用特定的语法。”

对于像DocLang这样可应用于内容摄取的标准,他表示:“我认为将其自动化是可行的,这似乎也是其意图所在。我设想的用例是,当我将文档上传到智能代理时,可以运行一项技能将文档预处理为DocLang标准格式,从而节省分词资源。”他认为这很有意义,并补充说,如果它有助于生成可在AI工具之外共享的输出,如可视化内容,那就更好了。他还表示喜欢Web MCP,因为只需在页面上添加一些代码,如CSS或JavaScript,消费者(在这种情况下是AI浏览器或技能)就能更好地处理网站。

他指出:“这些标准需要确保人类仍然能够按照自己的意愿行事,并且无需了解任何编码知识就能熟练使用。至于治理方面,我不确定它是否重要。”

不过,有分析师预见到DocLang的使用会引发治理问题。Info - Tech Research Group高级研究分析师亚兹·帕拉尼查米(Yaz Palanichamy)表示,采用DocLang需要组织实施和审查控制措施,以确保其使用在可问责和安全的前提下进行扩展。那么,DocLang能否在解决人工智能文档处理难题的同时,有效应对治理问题呢?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/17 19:12:26

2026年广东亚马逊培训机构梳理:五家机构侧重点观察

阅读提示:本文基于公开市场信息及行业交流整理,仅代表第三方观察视角,旨在为创业者提供决策参考。不构成任何投资建议或消费引导,请结合自身实际情况审慎判断。1. 行业背景1.1 行业发展现状2026年的亚马逊生态已全面进入"精细…

作者头像 李华
网站建设 2026/6/17 19:02:59

如何高效部署Kubernetes网络插件:专业运维的完整镜像加速指南

如何高效部署Kubernetes网络插件:专业运维的完整镜像加速指南 【免费下载链接】public-image-mirror 很多镜像都在国外。比如 gcr 。国内下载很慢,需要加速。致力于提供连接全世界的稳定可靠安全的容器镜像服务。 项目地址: https://gitcode.com/GitHu…

作者头像 李华
网站建设 2026/6/17 18:57:59

B站考公课和粉笔怎么选?

B站考公课和粉笔怎么选?更新日期:2026年6月15日Many 人备考会先刷 B 站:免费多、 UP 主讲解细,看着很香。同时手机里又装着粉笔 App。于是问:B 站考公课和粉笔怎么选?能不能只看不买? 这篇按用户…

作者头像 李华
网站建设 2026/6/17 18:42:24

ZigBee OTA升级与诊断集群:物联网设备远程维护与网络健康监控实战

1. 项目概述与核心价值在物联网设备,尤其是基于ZigBee协议的智能家居、工业传感网络中,设备一旦部署,其维护和升级就成了一个现实且棘手的问题。想象一下,一个部署了上百个智能灯泡或传感器的楼宇,如果发现了一个固件漏…

作者头像 李华
网站建设 2026/6/17 18:39:27

从零开始:编写第一个鸿蒙(HarmonyOS)程序

文章目录一、引言二、动手编写:Hello HarmonyOS三、代码解析:每一行都是什么意思?3.1 Entry3.2 Component3.3 struct3.4 Index3.5 build() 函数3.6 Text 组件四、总结一、引言 对于刚接触鸿蒙(HarmonyOS)开发的朋友来…

作者头像 李华
网站建设 2026/6/17 18:33:24

深入解析NXP LA9310 VSPA IP:DMA状态寄存器与QAM系数表配置实战

1. 项目概述与核心价值 在嵌入式系统,尤其是通信基带处理这类对实时性和吞吐量要求极高的领域,直接内存访问控制器早已不是简单的“数据搬运工”。它更像是一个精密的交通枢纽,其内部状态、调度策略和异常处理机制,直接决定了整个…

作者头像 李华