【Ragflow】22.RagflowPlus(v0.3.0):用户会话管理/文件类型拓展/诸多优化更新
概述
在历经三周的阶段性开发后,RagflowPlus
顺利完成既定计划,正式发布v0.3.0
版本。
开源地址:https://github.com/zstar1003/ragflow-plus
新功能
1. 用户会话管理
在后台管理系统中,新增用户会话管理菜单。在此菜单中,可以查看每个用户的聊天历史信息。
2. 知识库图像预览显示
在前台知识库管理界面中,增加了一块关联图片显示区域。
如果chunk块具有关联图片,会在此区域显示。
3. 解析文件类型拓展
v0.2.1
版本中,解析仅支持三种简单类型:pdf、word、ppt。
v0.3.0
版本对文件类型进行进一步拓展,目前支持各种主流文件类型,包括:pdf、word、ppt、excel、txt、md、html、jpg、png、bmp。
其中,对于excel类型,做了单独的处理优化。
每个表格会单独将每行作为一个独立的chunk块,同时会自动添加表格表头。
上图展现了一个学生花名单的解析效果,通过自动添加表头,可以保证每列信息的准确含义,从而能够准确问答检索。
比如,我问某学生的学号,它能够找到正确的分块,从而进行回答。
此外,对于图像类型的文件,也能正常解析。
4. 聊天对话字体动态调节
在前台聊天界面中,额外添加了一个设置按钮,可以动态调节聊天窗口显示的字体大小。
经测试,使用docker部署时,该功能可能不生效,仍需进行排查修复。
改进优化
1. 信息自定义排序
在后台管理系统中,大部分表格都配置了排序功能。
这样可以根据条件(如创建时间)进行排序,从而快速筛选出记录。
在向知识库添加文件时,也可以通过该方式,快速添加最新上传的文件内容。
2. 知识库创建优化
在知识库创建界面中,新增创建人
选项,可以在已有用户中添加。
通过该选项,可为不同用户单独添加知识库。
同时,对于每个知识库,新增修改
选项,从而可以让知识库权限在个人和团队中自由设定。
3. 嵌入模型适配硅基流动API
v0.2.1
版本中,后台解析并不支持配置的在线嵌入模型。
在v0.3.0
版本中,增加了对硅基流动平台的模型适配。
如果不想在本地下载embedding模型,可以直接在硅基流动平台上,注册密钥,配置使用。
硅基流动地址:https://cloud.siliconflow.cn/i/J8xf97VO
具体修改方式是先用初始用户(第一个创建的用户)登录前台系统,配置好模型信息。
配置完成后,后台测试嵌入模型配置时,信息自动更新。
需要注意的是,对于同一个知识库,不能混用不同的解析模型,否则会出现异常。
为防止误操作,该版本强制统一嵌入模型为bge-m3,使用其它嵌入模型将可能无法正常工作。
4. 修复用户人数>10人时,团队添加成员显示不全问题
当前版本,团队中可自由添加所有成员,且默认采用倒序排序,可以快速选择新用户。
5. 修复用户创建时间异常问题
设置时区为东八区(UTC+8时区
),解决用户创建时间显示异常问题。
6. 移除vllm的docker默认配置
docker配置文件中,移除vllm的默认容器配置,因为 vllm 默认拉取使用的模型是 float16 精度,导致众多用户因显存不足无法正常使用。
对于个人用户,推荐使用ollama,默认拉取的模型为 int4 精度,比较友好。
7. MinerU版本更新
采用当前最新版本的MinerU(v1.3.11),性能较先前版本会略有提升。
8. minio地址可编辑
在docker/.env
文件中,新增MINIO_VISIT_HOST
用于动态控制minio上传文件时的ip地址。
如需将解析图片配置公网访问,可修改此地址为公网地址。
9. 其它优化
其它细碎更新点,不逐一罗列,具体可见仓库Commits记录。
下版本开发计划
下版本的工作重点将围绕临时文件上传和文档撰写两个功能项进行优化。
文件上传优化方向
在原版的 ragflow 中,用户在问答界面中,上传文件后,文件会自动将文件添加进知识库,并自动进行解析。
ragflow-plus的改进思路是:将用户上传的文件进行临时解析,插入缓存数据库,而不是直接塞入存储库中。
根据解析得到的文件文本信息,作为问答参考的一部分。
文档撰写优化方向
文档撰写主要有以下优化方向:
-
1.文档模板支持自定义
-
2.文档内容支持暂存
-
3.文档撰写时,调用单独的模型问答接口
-
4.支持问答结果的流式输出
-
5.导出word时,支持图文内容
该方向部分功能原本计划在此版本完成,但鉴于鸽🕊得过久,移到下版本在做。
问题反馈
在使用过程中,如遇到问题,可以在开源仓库中提交issue。
提交同时,推荐附上容器日志信息,比如在后台管理系统中,遇到解析失败的问题,可以查看后台容器日志信息:
docker logs ragflowplus-management-backend
相关文章:

【Ragflow】22.RagflowPlus(v0.3.0):用户会话管理/文件类型拓展/诸多优化更新
概述 在历经三周的阶段性开发后,RagflowPlus顺利完成既定计划,正式发布v0.3.0版本。 开源地址:https://github.com/zstar1003/ragflow-plus 新功能 1. 用户会话管理 在后台管理系统中,新增用户会话管理菜单。在此菜单中&…...

使用PocketFlow构建Web Search Agent
前言 本文介绍的是PocketFlow的cookbook中的pocketflow-agent部分。 回顾一下PocketFlow的核心架构: 每一个节点的架构: 具体介绍可以看上一篇文章: “Pocket Flow,一个仅用 100 行代码实现的 LLM 框架” 实现效果 这个Web S…...
安卓基础(Bitmap)
Bitmap 是 Android 开发中一个非常重要的类,用于表示图像数据。它是一个位图对象,存储了图像的像素信息,可以用于显示、处理和保存图像。Bitmap 提供了丰富的 API,用于操作和处理图像数据。 1. Bitmap 的作用 显示图像࿱…...

记录:echarts实现tooltip的某个数据常显和恢复
<template><div class"com-wapper"><div class"func-btns"><el-button type"primary" plain click"showPoint(2023)">固定显示2023年数据</el-button><el-button type"success" plain cli…...

八股文--JVM(1)
⭐️⭐️JVM内存模型 程序计数器:可以看作是当前线程所执行的字节码的行号指示器,用于存储当前线程正在执行的 Java 方法的 JVM 指令地址。如果线程执行的是 Native 方法,计数器值为 null。是唯一一个在 Java 虚拟机规范中没有规定任何 OutOf…...

从RPA项目说说RPC和MQ的使用。
去年我负责一个 RPA(机器人流程自动化)项目,帮某电商公司搭建订单处理系统。项目里有个场景特别有意思:当用户下单后,系统需要同时触发库存扣减、物流调度、积分发放三个模块。一开始我们想都没想,直接用 R…...
【大模型面试每日一题】Day 21:对比Chain-of-Thought(CoT)与Self-Consistency在复杂推理任务中的优劣
【大模型面试每日一题】Day 21:对比Chain-of-Thought(CoT)与Self-Consistency在复杂推理任务中的优劣 📌 题目重现 🌟 面试官:我们在数学推理和逻辑推理任务中发现,Self-Consistency方法比传统…...

UUG杭州站 | 团结引擎1.5.0 OpenHarmony新Feature介绍
PPT下载地址:https://u3d.sharepoint.cn/:b:/s/UnityChinaResources/EaZmiWfAAdFFmuyd6c-7_3ABhvZoaM69g4Uo2RrSzT3tZQ?e2h7RaL 在2025年4月12日的Unity User Group杭州站中,Unity中国OpenHarmony技术负责人刘伟贤带来演讲《团结引擎1.5.0 OpenHarmony新…...

Vue3——父子组件通信
在Vue开发中,组件通信是核心概念之一。良好的组件通信机制能让我们的应用更加清晰、可维护。 父传子defineProps defineProps是一个编译时宏,仅在内部可用,不需要显式导入。声明的 props 会自动暴露给模板。 还返回一个对象,其中…...

游戏引擎学习第276天:调整身体动画
运行游戏,演示我们遇到的拉伸问题,看起来不太好,并考虑切换到更顶视角的视角 我们开始讨论游戏开发中的一些美学决策,特别是在处理动画方面。虽然我们是游戏程序员,通常不负责设计或艺术部分,但因为这是一…...

从开发者角度看数据库架构进化史:JDBC - 中间件 - TiDB
作者: Lucien-卢西恩 原文来源: https://tidb.net/blog/e7034d1b Java 应用开发技术发展历程 在业务开发早期,用 Java 借助 JDBC 进行数据库操作,虽能实现基本交互,但需手动管理连接、编写大量 SQL 及处理结果集&a…...

Mipsel固件Fuzzing小记
Mipsel固件Fuzzing小记 0x01 准备 1.1 安装必要工具链 首先需要安装 MIPS 交叉编译工具链和相关依赖: sudo apt-get install -y gcc-mipsel-linux-gnu g-mipsel-linux-gnu binwalk qemu-user-static afl这些工具分别用于:交叉编译、固件解包、二进制…...

本土DevOps革命:Gitee如何撬动中国企业的数字化转型新动能
在数字化浪潮席卷全球的背景下,中国企业正面临前所未有的转型压力与机遇。随着《数据安全法》和《个人信息保护法》的全面实施,以及信创产业政策的深入推进,研发工具链的自主可控已成为关乎企业核心竞争力的战略命题。在这一关键赛道上&#…...
关于此站点更改通知.top域名后期将统一更换为snowytime.cn访问,其余top访问进入过渡期
随着互联网技术的不断发展和域名应用的日益普及,为了更好地满足用户需求,提升网站访问体验,我们决定对现有的.top域名进行一次重大调整。自2025年6月1日起,.top域名后期将统一更换为snowytime.cn访问,其余top访问将暂时…...
使用python进行人员轨迹跟踪
一、系统概述 该系统基于计算机视觉技术,实现对视频或摄像头画面中的人员进行检测、跟踪,并生成轨迹数据。支持透视变换校准(鸟瞰图显示)、多目标跟踪、轨迹存储及视频录制功能,适用于安防监控、行为分析等场景。 二…...

强化学习入门:马尔科夫奖励过程二
文章目录 前言1、动作2、策略总结 前言 最近想开一个关于强化学习专栏,因为DeepSeek-R1很火,但本人对于LLM连门都没入。因此,只是记录一些类似的读书笔记,内容不深,大多数只是一些概念的东西,数学公式也不会…...

JVM 双亲委派机制
一、从 JDK 到 JVM:Java 运行环境的基石 在 Java 开发领域,JDK(Java Development Kit)是开发者的核心工具包。它不仅包含了编译 Java 代码的工具(如 javac),还内置了 JRE(Java Run…...

uniapp -- uCharts 仪表盘刻度显示 0.9999999 这样的值问题处理。
文章目录 🍉问题🍉解决方案🍉问题 在仪表盘上,23.8变成了 23.799999999999997 🍉解决方案 formatter格式化问题 1:在 config-ucharts.js 或 config-echarts.js 配置对应的 formatter 方法 formatter: {yAxisDemo1: function (...

BGP团体属性
团体属性: 1、用于限制BGP路由的传递范围 2、类似于IGP协议中的tag值,用于对BGP路由实现标记。 团体属性的分类: 1、公共团体属性: Internet:默认所有路由都有该属性,具有该属性BGP路由发送给所有的BGP邻居…...

Redis——三大策略
过期删除策略 Redis可以对key设置过期时间,因此需要有相应的机制将已过期的键值对删除 设置了过期时间的key会存放在过期字典中,可以用presist命令取消key过期时间 过期字典存储在redisDb结构中: typedef struct redisDb {dict *dict; …...

Windows 操作系统使用 Tcping 命令检查目标主机端口是否开放
检查目标主机端口是否开放的方法已经很多了,网络上也有第三方网页版的检查工具,这篇文章给大家介绍一个实用小工具 Tcping 。 一、下载安装 Tcping 命令 Tcping 非 Windows 自带命令,我们需要下载 Tcping 可执行文件,然后将该文…...
序列化和反序列化:从理论到实践的全方位指南
你好,我是 shengjk1,多年大厂经验,努力构建 通俗易懂的、好玩的编程语言教程。 欢迎关注!你会有如下收益: 了解大厂经验拥有和大厂相匹配的技术等 希望看什么,评论或者私信告诉我! 文章目录 一…...
PDF Base64格式字符串转换为PDF文件临时文件
需求描述: 在对接电子病历系统与河北CA,进行免密文件签章的时候,两者系统入参不同,前者是pdf文件,base64格式;后者要求File类型的PDF文件。 在业务中间层开发时,则需要接收EMR侧提供的base64格式…...

开源RTOS(实时操作系统):nuttx 编译
开源RTOS(实时操作系统):nuttx 编译 手册:Installing — NuttX latest documentation 源码:GitHub - apache/nuttx: Apache NuttX is a mature, real-time embedded operating system (RTOS) Installing The fir…...

python打包exe报错:处理文件时错误:Excel xlsx file; not supported
背景:最近用python写一个excel解析工具,然后打包成exe可执行文件的时候,遇到这样的问题 1.在我自己编译器运行是可以正常将上传后的excel进行解析,但是在打包成exe后,就无法正常解析excel 问题排查: 1.切换…...

VUE3 -综合实践(Mock+Axios+ElementPlus)
目录 前言 目标 1.工程创建 2.Mock 2.1 配置Mock 扩 展 2.2 定义模拟数据 2.3 创建Mock服务器 3.导入ElementPlus 4.表格页面搭建 5.动态路由跳转 6.详情页面的制作 前言 基于前文 VUE3详细入门,我们对VUE3的基本使用有了初步的了解,下…...

NDS3211HV单路H.264/HEVC/HD视频编码器
1产品概述 NDS3211HV单路高清编码器是一款功能强大的音/视频编码设备,支持2组立体声,同时还支持CC(CVBS)字幕。支持多种音频编码方式。该设备配备了多种音/视频输入接口:HD-SDI数字视频输入、HDMI高清输入(支持CC)、A…...

LeetCode热题100--206.反转链表--简单
1. 题目 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1] 示例 2: 输入:head [1,2] 输出:[2,1] 示例 3&…...

来一个复古的技术FTP
背景 10年前的老代码,需要升级springboot框架,在升级过程中,测试业务流程里,有FTP的下载业务,不管测试环境如何测试,都没有成功,最后只能自己搭建一个FTP服务器,写一个ftp-demo来测试…...
OpenCV CUDA模块中矩阵操作------分布统计类
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 在 OpenCV 的 CUDA 模块中,meanStdDev 函数用于计算矩阵的平均值(Mean)和标准差(StdDevÿ…...