近日,OpenDataLab与钉钉联合推出企业级文档解析工具DLU(Document Language Understanding),旨在通过开源技术降低AI应用开发门槛,加速企业智能化转型。该工具基于上海AI实验室研发的智能文档解析引擎MinerU,已在GitHub获得超4万星标,其2.0版本以0.98B参数实现媲美72B主流大模型的解析性能。
DLU的核心优势在于多格式兼容与场景适配能力。工具支持Office、PDF、Markdown及钉钉自有文档格式,可精准提取图表、化学分子式等复杂元素,并内置金融、制造等6大行业解析模板。通过与钉钉生态的深度绑定,用户可在钉钉文档中直接实现合同关键字段标注、结构化数据导入知识库等功能。某制造企业应用后合同处理效率提升200%,某科技公司实现“文档上传→模型迭代”全链路4小时闭环。
OpenDataLab创始人何聪辉表示,DLU将“实验室能力”转化为“企业生产力”,其开源策略有望推动该工具成为“数据工具中的PyTorch”。钉钉方面则强调,DLU将助力企业筑牢数据根基,目前平台已为超10万用户提供200余万次数据服务。
行业分析指出,随着企业数字化转型加速,AI驱动的文档处理市场预计2025年规模达数十亿美元。DLU的推出不仅解决非结构化数据解析难题,其与钉钉办公场景的融合模式,或将为行业提供标准化技术范本。
© 版权声明
文章版权归作者所有,未经允许请勿转载。