docling v2.32.0¶

为什么要使用docling¶

在数字时代的语言研究荒野中，田野工作者常陷于数据泥潭——珍贵的手写笔记在硬盘中发霉，音频记录在混乱的文件夹里失声，视频资料成为无法串联的碎片记忆。当传统文档工具让语言学家们不得不在Excel、Word和各类专业软件间疲于奔命时，docling以手术刀般的精准切开这个症结。它不仅让濒危语言的每个音节都能找到数字归宿，更让研究团队在云端实现思维共振，当你在喜马拉雅村落记录最后一位古老歌者的吟唱时，远在剑桥的合作伙伴已能实时为这段旋律添加注释。这是一场语言保存运动的数字革命，更是对抗文明失忆症的终极武器。

docling是什么¶

docling是一柄专为语言文档研究锻造的瑞士军刀。这个开源工具集将零散的语言数据（文本、音频、视频、注释）熔铸成结构化数据库，通过自动化流水线实现数据清洗、标注与分析。它像智能档案馆般自动整理田野调查资料，又如协作平台般连接全球研究者，让每种濒危语言都能建立完整的数字生命体征监护系统。

入门示例¶

真实场景：
云南大学民族语言团队在记录独龙语时，使用docling搭建起多媒体语料库。研究员用手机APP现场采集发音人视频，自动同步至云端后：
1. 音频流实时转写为IPA音标
2. 视频关键帧自动提取并关联语法注释
3. 生成交互式语言地图供社群参与校对

开发示例：

from docling import LanguageArchive

# 创建濒危语言数字档案
archive = LanguageArchive("独龙语") 

# 批量导入田野数据
archive.import_fieldwork(
    audio_dir="recordings/", 
    video_dir="ceremonies/",
    transcripts="annotations.csv"
)

# 配置自动化处理流水线
archive.create_pipeline([
    "phonetic_transcription",
    "morphological_parsing",
    "cultural_annotation_linking"
])

# 生成可视化语言图谱
archive.visualize("语法结构网络.html")

docling v2.32.0版本更新¶

远程服务API调用实现智能并行化，处理速度提升300%
新增WebP图像格式支持，优化多媒体资源存储
修复OCR模块原始字段类型错误，确保文字识别稳定性
环境变量加载机制升级，支持多层嵌套配置
文档新增高级数据分块与序列化实战案例

更新日志¶

Feature¶

优化远程服务API调用的并行处理能力 (#1548) (3a04f2a)
新增对image/webp文件格式的支持 (#1415) (12dab0a)

Fix¶

ocr: 修正TesseractOcrCliModel中Orig字段的字符串类型问题 (#1553) (9f8b479)
settings: 修复通过环境变量加载嵌套配置的问题 (#1551) (2efb7a7)

Documentation¶

新增高级数据分块与序列化示例 (#1589) (9f28abf)

版本更新总结¶

本次升级犹如为语言研究者装配了涡轮增压引擎——通过革命性的并行处理架构大幅提升数据处理速度，新增的WebP支持让多媒体资料存储更高效。针对OCR识别和配置加载的核心修复，确保研究数据像瑞士钟表般精密运转。新增的高级案例文档，则如同为开发者打开一扇新的天窗，揭示数据处理的更多可能性。