跳转至

ragflow RAGFlow-0.12.0

为什么要使用ragflow

在当今快速发展的技术环境中,数据处理和信息提取的需求日益增加。然而,许多现有工具往往无法满足复杂的需求,导致开发者在选择合适的解决方案时面临困惑。ragflow的出现,正是为了打破这一局限。它不仅提供了强大的功能,还能灵活适应不同的应用场景,帮助开发者高效地处理数据流。想象一下,您正在开发一个需要实时处理和分析大量数据的应用,ragflow将成为您不可或缺的助手,帮助您在竞争中脱颖而出。

ragflow是什么

ragflow是一个开源项目,旨在简化和优化数据流处理。它结合了多种先进的技术,支持灵活的数据输入和输出格式,能够高效地处理复杂的数据流任务。通过ragflow,开发者可以轻松构建和管理数据流,提升工作效率。

入门示例

假设您正在开发一个在线教育平台,需要实时分析学生的学习数据。使用ragflow,您可以轻松创建一个数据流,将学生的学习记录从数据库中提取出来,经过数据清洗和转换后,生成可视化报告。具体步骤如下:

  1. 数据提取:使用ragflow连接到数据库,提取学生的学习记录。
  2. 数据处理:通过ragflow的处理组件,对数据进行清洗和转换,例如去除重复记录、格式化日期等。
  3. 数据输出:将处理后的数据输出为可视化报告,供教师和管理人员分析。

通过这个示例,您可以看到ragflow如何帮助您快速构建复杂的数据流处理应用。

ragflow RAGFlow-0.12.0版本更新了什么

RAGFlow-0.12.0版本带来了多个重要更新,包括新增的精简版Docker镜像,改进了长上下文转换的效果,支持OpenTTS和SparkTTS,新增Excel解析方法,用户可以选择输出数据格式为HTML或行文本,并允许用户移除已添加的模型提供者。

更新日志

概要

  • 新增不包含嵌入和重排序模型的精简版Docker镜像。
  • 改进长上下文转换的效果。
  • 支持OpenTTS和SparkTTS。
  • 新增Excel解析方法,用户可以选择输出数据格式为HTML或行文本。
  • 用户可以移除已添加的模型提供者。

变更内容

  • 为“Switch”组件添加多语言描述,并更新消息助手占位符。
  • 修复文件管理器中的ppt文件错误。
  • 更新文档SDK。
  • 将create_timestamp_flt重命名为create_timestamp_float。
  • 修复superuser密码未进行base64编码的问题。
  • 修复不同供应商之间重复的llm名称。
  • 在文档SDK中重命名一些属性。
  • 修复来自文件管理器的pptx解析器。
  • 更新文档SDK。
  • 修复添加模型API时,VolcEngine创建api_key格式错误的问题。
  • 开放OpenAITTS。
  • 精炼TTS。
  • 存储:重命名所有与从minio获取文件相关的变量。
  • Web:显示当前使用的存储图标。
  • BugFix:修复VolcEngine的api_key生成错误。
  • 重构添加LLM。
  • 移除setting-system/index.tsx中的错误导入。
  • 更新README_zh.md。
  • 修复自部署的llm丢失问题。
  • 移除xinference中的key设置。
  • 使Excel解析可配置。
  • 精炼多轮对话的检索。
  • 精炼xinference。
  • 重新设计Dockerfile.scratch。
  • 修复添加模型时ollama在模型提供者页面无法选择的问题。
  • 恢复npm与yarn的替换。
  • 修复同一类别模型的合并问题。
  • 功能:Excel、HTML表格或行文本的可配置输出。
  • 功能:精炼多轮对话的检索。
  • 修复初始语言为英语但UI为中文的问题。
  • 修复组件重写错误。
  • 更新调试Web和Python的README。
  • 精炼markdown提示。
  • SparkTTS支持。
  • 精炼使用重排序模型。
  • 支持流输出,但对话分享不支持。
  • 添加删除llm供应商的API。
  • 修复Web代码在ARM机器上构建失败的问题。
  • 精炼代理中的多轮聊天。
  • 功能:添加YahooFinance组件。
  • 功能:添加Jin10组件。
  • 功能:删除模型提供者。
  • 添加lighten控制。
  • 修复tokenizer错误。
  • 多架构构建。
  • 功能:如果未设置模型,将弹出窗口提醒用户。
  • 使其变得轻便。
  • 恢复Dockerfile中的错误。
  • 添加投资顾问模板。
  • 轻微调整。
  • 从dockerfile中移除onnx复制命令。
  • 弃用初始化超级用户。
  • 添加浓缩器组件。
  • 更新dsl_examples并修复浓缩器组件。
  • 修复软链接。
  • 功能:添加浓缩器组件。
  • 修复renrank_model和pdf_parser错误 | 更新:会话API。
  • 添加两个开发者指南,并从README中移除“构建docker镜像”和“从源代码启动服务”。
  • 修复AzureOpenAI问题。
  • 移除WenCai的imageurl并更新投资顾问提示。
  • 支持aibot的代理。
  • 修复生成错误。
  • 修复-现在可以通过API运行电子邮件处理。
  • 强制通过EMAIL解析eml文件。
  • 更新Yichat的base_url。
  • 移除重复功能。
  • 样式:修复拼写错误和格式化代码。
  • 修复:发送第二条消息时显示第一条消息的问题。
  • 添加dev-slim文档。
  • 通过添加huggingface模型来增强功能。
  • 功能:为DeepLForm添加top_n。
  • 精炼get_input。
  • 修复:修复对话页面未显示对话列表的问题。
  • 处理task_executor中的小问题。
  • 修复logger错误。
  • 将chunk.status更改为chunk.available。
  • 修复可变默认参数。
  • 重构大整数以提高可读性。
  • 添加get_txt函数。
  • 为开发图像添加文档。
  • 精炼通用聊天机器人。
  • 将get_txt重命名为get_text。
  • 轻微调整。
  • 修复模板错误。
  • 更新组件描述。
  • 修复:上传文件过大时未显示错误消息的问题。
  • 更改本地llm部署指南的URL。
  • 修复:根据userType参数过滤timePeriod选项。
  • 在README中添加构建镜像和从源代码启动的说明。
  • 为发布准备文档。

总结

通过以上更新,ragflow在功能和性能上都有了显著提升,尤其是在数据处理的灵活性和用户体验方面。无论是新用户还是老用户,都能从中受益,进一步推动项目的发展和应用。