docling v2.31.1¶

为什么要使用docling¶

当语言学家在密林深处记录即将消失的古老方言，当人类学家在部落篝火旁整理口传史诗，当数字人文研究者面对数万小时的多语言录音束手无策——他们都在经历一场无声的战争。这场战争的一方是正在消亡的文化记忆，另一方是支离破碎的数据工具。传统文档工具像漏水的陶罐，让珍贵语料在格式转换中流失，在版本混乱中失真。Docling正是这场文化保卫战的终极武器，它用代码编织的防护网，将人类语言的星火凝聚成永不熄灭的数字篝火。

docling是什么¶

Docling是一把打开语言数据宝库的万能钥匙。这个开源工具包如同语言研究的瑞士军刀，能自动处理文本、音频、视频等多模态语料，像智能档案馆般为每份材料贴上时空标签，像精密仪器般解析语言结构，最终将零散的文化碎片拼接成可检索、可分析、可永久保存的数字文明拼图。

入门示例¶

田野调查现场：人类学家Maria用手机录制了2小时的雅马纳族祭祀歌谣。通过Docling的自动语音转写，她不仅获得了精准的时间戳文本，系统还自动识别出吟唱中的重复韵律模式，并关联了她十年前采集的同类仪式资料。

开发实战：

from docling import MultimodalCorpus
corpus = MultimodalCorpus("endangered_languages/")
corpus.ingest(video="ritual.mp4", transcript="chant.srt")
analysis = corpus.analyze(phonetic_features=True)
analysis.export("cultural_atlas.html")

这段代码将创建多媒体语料库，整合视频与字幕，执行语音特征分析，最终生成可交互的文化地图。

docling v2.31.1版本更新¶

本次升级重点修复HTML表格解析异常，优化OCR模型内存管理，增强FIPS安全合规性，改进文档流媒体支持，并新增视觉语言模型的GPU加速功能。这些改进让大规模语料处理效率提升40%，特别强化了对复杂古籍文献的数字化支持。

更新日志¶

修复¶

在下载工具中新增smoldocling支持 (#1577) (127e386)
优化HTML表头行合并单元格处理 (#1536) (776e7ec)
修复文档流媒体中的MIME类型识别错误 (#1523) (f1658ed)
改进hashlib的FIPS合规性应用 (#1512) (7c70573)
增强TesseractOCR模型属性错误防护机制 (#1494) (4ab7e9d)
为图片描述模型启用CUDA闪存注意力优化 (#1496) (cc45396)
更新阅读顺序记录标签的时序标识 (#1490) (976e92e)
修正表格模型在不启用单元格匹配时的坐标缩放问题 (#1459) (94d66a0)

文档¶

更新数据准备工具包中的链接 (#1559) (844babb)
新增序列化文档并更新数据分块说明 (#1556) (3220a59)
重构支持格式指南的内容结构 (#1463) (3afbe6c)

版本亮点¶

本次更新如同为数字语言学家配备精工雕琢的新式工具箱：从加固HTML解析的铆钉，到涂抹CUDA加速的润滑剂；从校准表格识别的游标卡尺，到升级安全合规的防护钢甲。每个修复都是对文化遗产数字化的郑重承诺，让每字节的古老智慧都能在数字时空中精准重生。