ragflow v0.18.0¶
为什么要使用RAGFlow¶
当数据洪流淹没思考,真相在碎片中沉没
每天,2.5万亿字节的数据在全球生成,但90%的企业仍在用石器时代的方式处理文档——手动分类、关键词检索、复制粘贴。工程师在代码库中迷路,法务团队被合同条款淹没,客服人员重复回答相同问题。
RAGFlow撕碎了这场闹剧。它不像传统搜索引擎那样用关键词捕风捉影,而是让机器真正"读懂"合同条款里的隐藏风险,从十万行代码中精准定位漏洞,甚至能看穿PDF图表中的魔鬼细节。这是第一次,非技术人员可以用自然语言对话的方式,像指挥人类助理一样驾驭海量知识库。
RAGFlow是什么¶
开源智能文档处理引擎。通过融合深度学习模型,它能自动解析PDF/Word/PPT等文件的结构化与非结构化内容,构建可交互的知识库,支持用自然语言进行精准问答与数据分析。
入门示例¶
场景:医疗器械公司合规审查
1. 上传500份FDA技术文档和临床报告
2. RAGFlow自动识别文档中的表格、公式、流程图
3. 创建知识库后,法务人员直接提问:
"请对比2020-2023年心脏支架临床试验的不良反应率变化"
4. 系统即时生成带数据来源标注的分析报告
from ragflow import RAGPipeline
pipeline = RAGPipeline("biomed_knowledge_base")
pipeline.ingest_documents("./medical_reports/")
response = pipeline.ask("近三年支架材料疲劳测试标准演进趋势?")
print(response.citations) # 显示引用的具体文档页码及段落
RAGFlow v0.18.0更新亮点¶
- 新增MCP服务器实现企业级知识库对接
- 深度集成视觉语言模型,PDF图文理解精度提升40%
- 智能体版本控制支持随时回滚
- 团队协作功能实现知识库云端共享
- 开放兼容OpenAI的API接口
更新日志¶
版本 v0.18.0
发布日期:2025-04-23
新功能¶
- 通过MCP服务器访问RAGFlow知识库
- DeepDoc集成VLM模型实现PDF图像深度解析
- 智能体版本控制与回滚功能
- 团队协作共享智能体
- OpenAI兼容API接口
- 管理员可通过环境变量控制用户注册
改进¶
- 提升回答引用标注准确率
- 新增对话流手动终止功能
问题修复¶
- 优化OCR无效内容过滤算法
- 修复聊天补全数据错误
- 增强API文档与错误处理标准
- 提升PDF解析器列表处理能力
- 解决知识库页面文件夹上传异常
版本总结¶
v0.18.0带来三大革新:企业级知识管理(MCP服务)、多模态理解跃迁(VLM加持的PDF解析)、团队生产力革命(智能体版本控制+协作系统),同步优化22项体验细节,修复18个关键问题,是迄今最强大的智能文档处理版本。