ragflow RAGFlow-0.12.0¶
为什么要使用ragflow¶
在当今快速发展的技术环境中,数据处理和信息提取的需求日益增加。然而,许多现有工具往往无法满足复杂的需求,导致开发者在选择合适的解决方案时面临困惑。ragflow的出现,正是为了打破这一局限。它不仅提供了强大的功能,还能灵活适应不同的应用场景,帮助开发者高效地处理数据流。想象一下,您正在开发一个需要实时处理和分析大量数据的应用,ragflow将成为您不可或缺的助手,帮助您在竞争中脱颖而出。
ragflow是什么¶
ragflow是一个开源项目,旨在简化和优化数据流处理。它结合了多种先进的技术,支持灵活的数据输入和输出格式,能够高效地处理复杂的数据流任务。通过ragflow,开发者可以轻松构建和管理数据流,提升工作效率。
入门示例¶
假设您正在开发一个在线教育平台,需要实时分析学生的学习数据。使用ragflow,您可以轻松创建一个数据流,将学生的学习记录从数据库中提取出来,经过数据清洗和转换后,生成可视化报告。具体步骤如下:
- 数据提取:使用ragflow连接到数据库,提取学生的学习记录。
- 数据处理:通过ragflow的处理组件,对数据进行清洗和转换,例如去除重复记录、格式化日期等。
- 数据输出:将处理后的数据输出为可视化报告,供教师和管理人员分析。
通过这个示例,您可以看到ragflow如何帮助您快速构建复杂的数据流处理应用。
ragflow RAGFlow-0.12.0版本更新了什么¶
RAGFlow-0.12.0版本带来了多个重要更新,包括新增的精简版Docker镜像,改进了长上下文转换的效果,支持OpenTTS和SparkTTS,新增Excel解析方法,用户可以选择输出数据格式为HTML或行文本,并允许用户移除已添加的模型提供者。
更新日志¶
概要¶
- 新增不包含嵌入和重排序模型的精简版Docker镜像。
- 改进长上下文转换的效果。
- 支持OpenTTS和SparkTTS。
- 新增Excel解析方法,用户可以选择输出数据格式为HTML或行文本。
- 用户可以移除已添加的模型提供者。
变更内容¶
- 为“Switch”组件添加多语言描述,并更新消息助手占位符。
- 修复文件管理器中的ppt文件错误。
- 更新文档SDK。
- 将create_timestamp_flt重命名为create_timestamp_float。
- 修复superuser密码未进行base64编码的问题。
- 修复不同供应商之间重复的llm名称。
- 在文档SDK中重命名一些属性。
- 修复来自文件管理器的pptx解析器。
- 更新文档SDK。
- 修复添加模型API时,VolcEngine创建api_key格式错误的问题。
- 开放OpenAITTS。
- 精炼TTS。
- 存储:重命名所有与从minio获取文件相关的变量。
- Web:显示当前使用的存储图标。
- BugFix:修复VolcEngine的api_key生成错误。
- 重构添加LLM。
- 移除setting-system/index.tsx中的错误导入。
- 更新README_zh.md。
- 修复自部署的llm丢失问题。
- 移除xinference中的key设置。
- 使Excel解析可配置。
- 精炼多轮对话的检索。
- 精炼xinference。
- 重新设计Dockerfile.scratch。
- 修复添加模型时ollama在模型提供者页面无法选择的问题。
- 恢复npm与yarn的替换。
- 修复同一类别模型的合并问题。
- 功能:Excel、HTML表格或行文本的可配置输出。
- 功能:精炼多轮对话的检索。
- 修复初始语言为英语但UI为中文的问题。
- 修复组件重写错误。
- 更新调试Web和Python的README。
- 精炼markdown提示。
- SparkTTS支持。
- 精炼使用重排序模型。
- 支持流输出,但对话分享不支持。
- 添加删除llm供应商的API。
- 修复Web代码在ARM机器上构建失败的问题。
- 精炼代理中的多轮聊天。
- 功能:添加YahooFinance组件。
- 功能:添加Jin10组件。
- 功能:删除模型提供者。
- 添加lighten控制。
- 修复tokenizer错误。
- 多架构构建。
- 功能:如果未设置模型,将弹出窗口提醒用户。
- 使其变得轻便。
- 恢复Dockerfile中的错误。
- 添加投资顾问模板。
- 轻微调整。
- 从dockerfile中移除onnx复制命令。
- 弃用初始化超级用户。
- 添加浓缩器组件。
- 更新dsl_examples并修复浓缩器组件。
- 修复软链接。
- 功能:添加浓缩器组件。
- 修复renrank_model和pdf_parser错误 | 更新:会话API。
- 添加两个开发者指南,并从README中移除“构建docker镜像”和“从源代码启动服务”。
- 修复AzureOpenAI问题。
- 移除WenCai的imageurl并更新投资顾问提示。
- 支持aibot的代理。
- 修复生成错误。
- 修复-现在可以通过API运行电子邮件处理。
- 强制通过EMAIL解析eml文件。
- 更新Yichat的base_url。
- 移除重复功能。
- 样式:修复拼写错误和格式化代码。
- 修复:发送第二条消息时显示第一条消息的问题。
- 添加dev-slim文档。
- 通过添加huggingface模型来增强功能。
- 功能:为DeepLForm添加top_n。
- 精炼get_input。
- 修复:修复对话页面未显示对话列表的问题。
- 处理task_executor中的小问题。
- 修复logger错误。
- 将chunk.status更改为chunk.available。
- 修复可变默认参数。
- 重构大整数以提高可读性。
- 添加get_txt函数。
- 为开发图像添加文档。
- 精炼通用聊天机器人。
- 将get_txt重命名为get_text。
- 轻微调整。
- 修复模板错误。
- 更新组件描述。
- 修复:上传文件过大时未显示错误消息的问题。
- 更改本地llm部署指南的URL。
- 修复:根据userType参数过滤timePeriod选项。
- 在README中添加构建镜像和从源代码启动的说明。
- 为发布准备文档。
总结¶
通过以上更新,ragflow在功能和性能上都有了显著提升,尤其是在数据处理的灵活性和用户体验方面。无论是新用户还是老用户,都能从中受益,进一步推动项目的发展和应用。