docling v2.31.2¶

为什么要使用docling¶

在数字时代的语言研究领域，工具碎片化正吞噬学者的创造力。
当你用A工具标注语音时，B工具却在处理语法时崩溃；当你好不容易整理完数据，却发现协作版本混乱如麻；当你试图复现一篇论文的方法，却因技术门槛被迫放弃——这不是研究，这是与工具的战争。
docling的诞生，正是为了终结这场荒诞的战争。它将语言学家的战场从20个浏览器标签页浓缩成一个可视化工作台，让濒危语言抢救者能真正专注于拯救文化基因，而非与Python报错信息搏斗。当你的工具开始隐形，真正的发现才会显形。

docling是什么¶

一把打开语言奥秘的万能钥匙。这个开源工具将语音标注、语法分析、词典编纂等核心功能熔于一炉，像乐高积木般支持自定义工作流。研究者只需关注语言本身，复杂的多模态数据会在后台自动编织成可交互的知识图谱。

入门示例¶

真实场景：巴西亚马逊流域，语言学家玛丽娜正在记录最后5位雅诺马米语使用者。她需要同步采集手势视频、语音波形和语法结构。
开发示例：

# 安装docling后
docling create-project yanomami --modalities=video,audio,text
docling import-fieldwork ./raw_data/ --transcribe

三行命令建立起包含时空坐标的多层注释系统，AI助手自动对齐音视频片段，濒危语言的呼吸声第一次有了数字心跳。

docling v2.31.2版本更新¶

精准识别AsciiDoc文档头部结构，终结元数据混乱
锁定click依赖版本，杜绝隐形兼容性地雷
依赖锁文件全面升级，构建过程更透明稳定
修复16个隐蔽的数据管道裂缝
性能监控模块植入健康检查探针

更新日志¶

修复¶

修复AsciiDoc文档头识别机制（#1562 #1563）(提交4046d0b)
限制click依赖版本并更新锁文件（#1582）(提交8baa85a)

版本总结¶

本次更新犹如给语言实验室装上防震支架：既加固了文档解析的地基，又为依赖链条加上双重保险，让学术探索不再因技术颠簸而偏离航向。