当前位置: 首页 > article >正文

RuoYi AI 开源全栈式 AI 开发平台,为客服团队打造一个企业级私有化智能问答助手(二)

第二步 环境部署第 2-3 天在完成需求定义之后接下来就要进入实施阶段最关键的一步——把 AI 助手平台实际跑起来。⚡ 本章部署原则考虑到企业内部数据安全和未来扩展性本部署全程采用本地化部署方案所有服务和数据均运行在企业内部服务器。两种部署方式任选一种即可推荐团队入门时优先选择 Docker 一键脚本熟悉后再通过 Docker Compose 进行精细化管理。 部署方式概览RuoYi AI 项目官方提供了完整的开源部署方案研发团队可根据实际情况选择以下两条路径部署路径适用场景硬件要求部署难度备注一键脚本部署推荐入门快速测试、初次上手、小规模验证最低 4H4G⭐ 简单自动化程度高交互式配置引导Docker Compose 部署生产环境、需精细控制配置最低 2H2G⭐⭐ 适中服务组件独立可控便于监控和扩展团队建议如果团队对 Docker 不够熟悉首次部署可以选择一键脚本路径快速验证如果是技术团队或有明确的生产环境需求Docker Compose 可以提供更灵活的配置和维护选项。⚙️ 前置环境检查在正式开始部署之前系统环境必须满足以下要求这部分是决定后续部署是否顺畅的关键。基础软件环境清单组件最低版本要求验证命令说明JDK17 或更高java -versionRuoYi AI 基于 Spring Boot 3.X 构建必须使用 JDK 17MySQL5.7 / 8.0mysql --version主业务数据库推荐 8.0 版本Redis≥ 5.0redis-cli ping高并发缓存与会话存储Maven≥ 3.8mvn -vJava 项目依赖管理和编译工具Node.js≥ 20node -v前端项目构建环境pnpm最新稳定版pnpm -v前端包管理器⚠️特别注意如果团队当前的开发环境仍是 Java 8 或 11需要提前安排升级或在新服务器上搭建。JDK 17 是 RuoYi AI 的运行底线不可绕过。 方案一一键脚本部署快速上手路径 Step 1获取项目源码并执行一键脚本从 Gitee 拉取项目推荐国内开发者使用速度快、访问稳定进入script/deploy/one-step-script目录执行一键部署脚本# 克隆项目 git clone https://gitee.com/ageerle/ruoyi-ai cd ruoyi-ai/script/deploy/one-step-script/ # 执行中文部署脚本拉取 Gitee 仓库 chmod x deploy-cn.sh ./deploy-cn.sh Step 2交互式配置参数说明脚本运行过程中会引导填写几个关键配置以下是最核心的几个参数配置类别参数名默认值使用建议MySQLMYSQL_ROOT_PASSWORDroot强烈建议修改为强密码至少包含大小写字母和数字MySQLMYSQL_DATABASEruoyi-ai可保持不变RedisREDIS_PASSWORD空生产环境必须设置访问密码前端端口WEB_PORT8081如果 8081 端口被占用修改为其他空闲端口如 18081管理员端口ADMIN_PORT8082同理如被占用请修改⚖️ Step 3选择镜像构建方式脚本运行后会询问一个关键问题 构建或部署选项 您想构建新镜像 (B) 还是直接使用现有镜像部署 (D)[B/d]:BBuild全新从源码编译构建适合本地源码有定制修改、或需要基于最新代码测试的场景。DDeploy with existing image推荐初次部署选择 D直接拉取官方已构建好的镜像进行部署省时省力适合快速验证。等待脚本运行完成全部依赖下载完成和容器启动成功后即可通过以下地址访问系统用户端http://服务器IP:8081默认账号demo / demo123管理后台http://服务器IP:8082默认账号admin / admin123 方案二Docker Compose 部署生产级推荐如果需要精细化管理各个服务组件数据库、缓存、向量数据库或已经有 Docker 运维经验推荐使用 Docker Compose 方式。 Step 1环境准备Docker 与 Docker ComposeDocker Compose 方式依赖 Docker 容器化环境以下是最低配置要求组件最低要求推荐配置说明Docker20.1024.0容器运行环境Docker Compose2.02.20服务编排工具内存8GB16GB建议为 Ollama 模型预留充足资源CPU4 核8 核多核利于容器并行运行验证 Docker 环境docker --version # 检查 Docker 版本应 ≥ 20.10 docker-compose --version # 检查 Docker Compose 版本 Step 2克隆项目并启动全套服务快速启动最简单的方式是直接拉取预先构建的 Docker Compose 配置文件git clone https://gitee.com/ageerle/ruoyi-ai cd ruoyi-ai/script/deploy/deploy docker-compose up -d等待镜像拉取和服务启动完成后访问方式同前用户端 8081 端口管理后台 8082 端口。 Step 3Docker Compose 部署架构深度解析RuoYi-AI 的 Docker Compose 部署采用了微服务架构设计通过 Docker Compose 统一管理多个核心服务组件。启动docker-compose up -d后实际上启动了一套完整的服务集群docker-compose.yml中包含的核心服务及作用如下服务组件镜像核心职责关键配置说明MySQL 8.0mysql:8.0.33存储用户信息、会话数据、模型配置等业务数据使用utf8mb4字符集支持完整 Unicode 字符通过 Volume 映射实现数据持久化Redis 6.2redis:6.2高性能缓存与会话存储开启 AOF 持久化机制支持密码认证Redis 数据目录映射到宿主机Weaviate默认向量库semitechnologies/weaviate:1.30.0向量数据库用于语义搜索和相似性检索支持 HTTP 和 gRPC 双协议支持多种向量化模块数据独立持久化存储 Docker Compose 部署的三大核心设计环境一致性所有组件运行在容器中彻底避免了在我机器上能跑到服务器就出问题的尴尬。一键启停docker-compose up -d一条命令完成全部部署守护进程模式确保服务不会被终端关闭影响。数据持久化MySQL、Redis、向量数据库的数据目录均映射到宿主机容器重启后数据依然保留。 部署 Ollama 模型服务核心 AI 引擎无论通过上述哪种方式完成了 RuoYi AI 平台主容器的部署接下来都需要配置 AI 模型的运行环境Ollama。这一步是让整个 AI 问答系统真正“活”起来的关键。⚡ 为什么需要本地部署 Ollama根据本项目的红线要求“所有企业业务数据不出内网服务器”不能依赖云端大模型 API。Ollama 正是在本地服务器上运行大语言模型的首选方案。 第一步下载 Ollama 安装包访问 Ollama 官网 https://ollama.com/ 下载对应操作系统的最新安装程序Linux执行curl -fsSL https://ollama.com/install.sh | shWindows双击执行OllamaSetup.exe完成安装macOS下载.dmg文件安装即可安装完成后验证ollama --version # 应输出版本号如 ollama version 0.1.xx 第二步下载问答模型与向量模型根据项目场景和服务器配置选择合适的模型。我们选择通义千问 qwen2:0.5b 作为基础问答模型配合 embeddinggemma:300m 作为本地向量化模型。qwen2:0.5b阿里巴巴通义千问系列的轻量级版本参数量 5 亿在中文理解和生成方面表现出色对硬件要求较低适合中文企业知识库场景。embeddinggemma:300mGoogle 的轻量级向量嵌入模型负责将文档块转换为向量表示是实现 RAG 相似性匹配的核心。# 下载基础问答模型~352 MB ollama pull qwen2:0.5b # 下载向量模型~621 MB ollama pull embeddinggemma:300m # 验证模型已成功安装 ollama list⚡ 第三步测试模型是否正常可用# 测试问答模型 ollama run qwen2:0.5b 你好请介绍一下 AI 的基本概念。如果模型正常返回内容中文回答则 Ollama 服务已准备就绪。 部署 Milvus 向量数据库构建 RAG 知识库的基础在上一章的需求中我们明确要求实现对私有文档的问答RAG 检索增强生成。RuoYi AI 平台提供了一套完整的本地化 RAG 方案——集成 Milvus 向量库、本地向量化模型与 Ollama实现纯本地化的文档检索与知识库构建。Q选择 Weaviate 还是 MilvusRuoYi AI 采用策略模式Strategy Pattern对多个向量存储后端提供了统一的抽象接口默认预配置的是WeaviateMilvus 只需修改application.yml中的配置vector-store: type: milvus即可。两者功能完整度相近推荐先使用默认的 Weaviate。 第一步编写或复用 docker-compose.ymlMilvus Etcd MinIO在部署目录下创建docker-compose.yml或在 RuoYi AI 默认配置文件中集成内容如下version: 3.5 services: etcd: container_name: milvus-etcd image: quay.io/coreos/etcd:v3.5.5 environment: - ETCD_AUTO_COMPACTION_MODErevision - ETCD_AUTO_COMPACTION_RETENTION1000 - ETCD_QUOTA_BACKEND_BYTES4294967296 - ETCD_SNAPSHOT_COUNT50000 volumes: - ./volumes/etcd:/etcd command: etcd -advertise-client-urlshttp://127.0.0.1:2379 -listen-client-urls http://0.0.0.0:2379 --data-dir /etcd network_mode: host minio: container_name: milvus-minio image: minio/minio:RELEASE.2023-03-20T20-16-18Z environment: MINIO_ACCESS_KEY: minioadmin MINIO_SECRET_KEY: minioadmin command: minio server /minio_data --console-address :9001 volumes: - ./volumes/minio:/minio_data network_mode: host milvus: container_name: milvus-standalone image: milvusdb/milvus:v2.3.3 command: milvus run standalone environment: ETCD_ENDPOINTS: localhost:2379 MINIO_ADDRESS: localhost:9000 volumes: - ./volumes/milvus:/var/lib/milvus network_mode: host 第二步启动 Milvus 服务docker-compose up -d 第三步配置 RuoYi AI 连接到 Milvus在 RuoYi AI 的配置文件ruoyi-admin/src/main/resources/application.yml中确认或修改vector-store相关配置vector-store: type: milvus # 使用 Milvus 作为向量存储也可换为 weaviate milvus: url: http://localhost:19530 collectionname: LocalKnowledge⚠️ 潜在错误处理常见问题如embeddinggemma:300m模型向量维度不匹配可通过 Milvus 官方可视化面板 Attu 索引检查库集合的维度设置。平台提供了createSchema()方法会自动检测嵌入模型的向量维度并按基类名 知识库 ID 创建独立集合避免维度冲突。✅ Step 7功能验证与访问检查完成以上所有部署步骤后逐项验证系统是否正常。验证清单MySQL 容器正常运行docker-compose ps | grep mysqlRedis 容器正常运行docker-compose ps | grep redisMilvus / Weaviate 向量库容器正常运行docker-compose ps | grep -E milvus|weaviateRuoYi AI 后端主容器正常运行docker-compose ps | grep ruoyiOllama 模型服务正常运行ollama list能看到qwen2:0.5b和embeddinggemma:300m登录验证# 浏览器访问以下两个地址 http://服务器IP:8081 # 用户前端 http://服务器IP:8082 # 管理后台 # 默认登录凭据 管理员账号admin / admin123 普通用户端demo / demo123如果两个界面都可以正常登录且管理后台中可以进入模型配置查看已接入的 AI 大模型配置说明 RuoYi AI 平台已经成功完成本地化部署。 避坑指南问题场景建议排查路径Docker 镜像拉取超时配置国内 Docker 镜像加速器阿里云、中科大均可并添加{registry-mirrors: [https://registry.cn-hangzhou.aliyuncs.com]}到 Docker Daemon 配置文件启动后前端无法访问先检查端口是否被占用netstat -anp | grep 端口号再检查防火墙是否放行对应端口sudo ufw status/firewall-cmd --list-ports向量库连接报错到application.yml中确认 Milvus/Weaviate 的 URL 是否为localhost:19530localhost:6038且对应容器在 Docker 中正常运行docker psOllama 模型拉取缓慢可以考虑使用HF_ENDPOINT配置 Hugging Face 镜像源export HF_ENDPOINThttps://hf-mirror.com后重新执行ollama pullRedis 连接异常检查redis.conf是否绑定了127.0.0.1生产环境建议绑定0.0.0.0 本章小结恭喜通过一键脚本或 Docker Compose 配置配合 Ollama 本地模型服务与 Milvus 向量库已经完成了完整的环境部署和验证。接下来系统将进入业务数据接入阶段——按照需求定义的客户文档与 FAQ 内容通过后台管理界面上传到知识库并配置相应的菜单权限和角色访问策略。

相关文章:

RuoYi AI 开源全栈式 AI 开发平台,为客服团队打造一个企业级私有化智能问答助手(二)

第二步 环境部署(第 2-3 天) 在完成需求定义之后,接下来就要进入实施阶段最关键的一步——把 AI 助手平台实际跑起来。 ⚡ 本章部署原则:考虑到企业内部数据安全和未来扩展性,本部署全程采用本地化部署方案&#xff0…...

从零开始:使用 VS Code 开发 Solidity 智能合约完整实战指南

手把手带你搭建本地 Solidity 开发环境,从安装配置到编译部署,轻松上手智能合约开发 一、写在前面 在区块链世界里,智能合约是不可或缺的核心组件,而 Solidity 则是编写智能合约最主流的编程语言。很多刚接触 Web3 开发的小伙伴&…...

如何从Chrome中提取保存的密码:3种方法解决密码遗忘困境

如何从Chrome中提取保存的密码:3种方法解决密码遗忘困境 【免费下载链接】chromepass Get all passwords stored by Chrome on WINDOWS. 项目地址: https://gitcode.com/gh_mirrors/chr/chromepass Chrome密码提取工具(chromepass)是一…...

TPFanCtrl2:让你的ThinkPad风扇告别噪音,实现精准智能控制

TPFanCtrl2:让你的ThinkPad风扇告别噪音,实现精准智能控制 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 你是否厌倦了ThinkPad风扇在轻度使用…...

2026年免费付费AIGC检测渠道全汇总,查AIGC看这篇就够了!

2026年答辩季临近,AIGC检测已经成为大多数高校论文审核的标配流程。不管你有没有用过A论文,学校都可能会查一遍AI率。很多同学的第一反应就是:ai率查重要多少钱?有没有能免费查AI率的工具? 有免费的aigc检测工具&…...

论文需要aigc查重嘛?有哪些靠谱的AIGC检测和降重ai率工具?

2026年答辩季临近,AIGC检测已经成为大多数高校论文审核的标配流程。不管你有没有用过A论文,学校都可能会查一遍AI率。很多同学的第一反应就是:ai率查重要多少钱?有没有能免费查AI率的工具? 有免费的aigc检测工具&…...

PiliPlus跨平台B站客户端:从零开始的完整使用指南

PiliPlus跨平台B站客户端:从零开始的完整使用指南 【免费下载链接】PiliPlus PiliPlus 项目地址: https://gitcode.com/gh_mirrors/pi/PiliPlus 想要在手机、电脑、平板等所有设备上流畅观看B站视频吗?PiliPlus跨平台B站客户端就是你的理想选择&a…...

降AI检测率用什么工具好?率零最低2元/千字,适合本科论文降AI!

一、前言:2026 年毕业必须通过aigc检测 2026年各高校对学术论文的AIGC疑似度的审查全面变严,均发布了具体AIGC检测报告和数值要求,211和985高校规定本科论文AI率要低于20%,硕士要求 AI 率不高于15%。普通高校一般要求AI率控制在 …...

自动化工作流开发:OCR识别致PDF信息提取、数学计算与Word计算书生成

自动化工作流开发:OCR识别致PDF信息提取、数学计算与Word计算书生成 一、项目概要与应用场景分析 在当下数字化转型全面加速的进程中,各类工程计算、财务核算、学术分析等工作场景中,存在大量从文档中提取结构化信息、执行数学计算并生成标准化报告的需求。以工程领域为例…...

怎样高效部署ClearerVoice-Studio:专业级AI语音处理工具包全面指南

怎样高效部署ClearerVoice-Studio:专业级AI语音处理工具包全面指南 【免费下载链接】ClearerVoice-Studio An AI-Powered Speech Processing Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Enhancement, Separation, and Target Speaker Extr…...

如何快速提取B站视频字幕:终极免费工具使用指南

如何快速提取B站视频字幕:终极免费工具使用指南 【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC字幕及转换的工具; 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle 还在为B站视频的字幕无法保存而烦恼吗?想要…...

WPS-Zotero集成方案:跨平台科研写作工作流优化

WPS-Zotero集成方案:跨平台科研写作工作流优化 【免费下载链接】WPS-Zotero An add-on for WPS Writer to integrate with Zotero. 项目地址: https://gitcode.com/gh_mirrors/wp/WPS-Zotero WPS-Zotero插件为科研工作者提供了跨平台文献管理集成方案&#x…...

3个场景玩转抖音下载器:从零到批量下载的完整指南

3个场景玩转抖音下载器:从零到批量下载的完整指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. …...

Cat-Catch浏览器扩展终极指南:一站式网页资源嗅探与流媒体捕获解决方案

Cat-Catch浏览器扩展终极指南:一站式网页资源嗅探与流媒体捕获解决方案 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否经常遇到…...

别再只会背 redo/undo!InnoDB 五大日志完整闭环,弄懂才算真正懂 MySQL

别再只会背 redo/undo!InnoDB 五大日志完整闭环,弄懂才算真正懂 MySQL 很多后端程序员、新手DBA都有一个通病:MySQL知识点背得滚瓜烂熟,面试一问就懵,线上一出数据库故障直接束手无策。 平时写 CRUD 业务代码轻轻松松&…...

Flask模板引擎 Jinja2 进阶:宏定义、过滤器与模板继承的复用

更多内容请见: 《Python Web项目集锦》 - 专栏介绍和目录 文章目录 第一章:打破复制的诅咒——为什么我们需要模板复用? 第二章:组件化思维的萌芽——深入理解宏 2.1 宏的基础语法 2.2 宏的进阶:处理动态属性与默认值 2.3 宏的终极形态:导入与跨文件共享 第三章:数据整容…...

如何快速修复损坏的MP4视频:Untrunc终极指南

如何快速修复损坏的MP4视频:Untrunc终极指南 【免费下载链接】untrunc Restore a truncated mp4/mov. Improved version of ponchio/untrunc 项目地址: https://gitcode.com/gh_mirrors/un/untrunc Untrunc视频修复工具是一款专业、免费的开源软件&#xff0…...

Divinity Mod Manager架构解析:神界原罪2模组管理技术实现

Divinity Mod Manager架构解析:神界原罪2模组管理技术实现 【免费下载链接】DivinityModManager A mod manager for Divinity: Original Sin - Definitive Edition. 项目地址: https://gitcode.com/gh_mirrors/di/DivinityModManager Divinity Mod Manager是…...

LRCGet:本地音乐库同步歌词自动匹配的终极解决方案

LRCGet:本地音乐库同步歌词自动匹配的终极解决方案 【免费下载链接】lrcget Utility for mass-downloading LRC synced lyrics for your offline music library. 项目地址: https://gitcode.com/gh_mirrors/lr/lrcget LRCGet是一款专为本地音乐爱好者设计的开…...

XLeRobot终极指南:如何用660美元打造你的家庭双手机器人

XLeRobot终极指南:如何用660美元打造你的家庭双手机器人 【免费下载链接】XLeRobot XLeRobot: Practical Dual-Arm Mobile Home Robot for $660 项目地址: https://gitcode.com/GitHub_Trending/xl/XLeRobot 还在为昂贵的机器人平台望而却步?XLeR…...

WaveDrom:3分钟掌握专业数字时序图绘制的终极指南

WaveDrom:3分钟掌握专业数字时序图绘制的终极指南 【免费下载链接】wavedrom :ocean: Digital timing diagram rendering engine 项目地址: https://gitcode.com/gh_mirrors/wa/wavedrom 在数字电路设计、硬件工程和嵌入式系统开发中,清晰准确的时…...

突破性音乐解锁方案:一站式解决加密音频格式兼容性难题

突破性音乐解锁方案:一站式解决加密音频格式兼容性难题 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: http…...

Stream-rec直播流录制:从零开始构建你的自动化录播系统

Stream-rec直播流录制:从零开始构建你的自动化录播系统 【免费下载链接】stream-rec Automatic streaming record tool. Live stream and bullet comments recorder. 虎牙/抖音/斗鱼/Twitch/PandaTV/微博直播,弹幕自动录制 项目地址: https://gitcode.…...

LinkSwift:跨平台网盘直链解析引擎的技术架构与配置指南

LinkSwift:跨平台网盘直链解析引擎的技术架构与配置指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天…...

破解海投内卷:留学生如何通过“影子就业市场”斩获未公开的优质科技 Offer

在留学生的求职规划中,许多家庭和学生都陷入了一个巨大的信息差陷阱:每天紧盯跨国科技巨头的官网,在 LinkedIn 上疯狂点击“Easy Apply(一键投递)”。然而,当一份常规的初级软件开发(SDE&#x…...

CompressO视频压缩工具:3分钟掌握免费开源的多媒体压缩神器

CompressO视频压缩工具:3分钟掌握免费开源的多媒体压缩神器 【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mirrors/co/compre…...

破局“银行+电信”老路:澳洲气候科技(ClimateTech)与绿色能源的 IT 高薪人才缺口

在规划留学生计算机科学(CS)与软件工程的澳洲就业路径时,许多家长和学生常常陷入一种固化的认知:在澳洲学 IT,毕业后的终极目标无非是挤进“四大行”(如 CBA、NAB)做金融科技,或是进…...

校园小情书微信小程序源码 _ 社区小程序前后端开源 _ 校园表白墙交友小程序

内容目录一、详细介绍二、效果展示1.部分代码2.效果图展示三、学习资料下载一、详细介绍 校园小情书微信小程序源码 | 社区小程序前后端开源 | 校园表白墙交友小程序 功能: 表白墙 卖舍友 步数旅行 步数排行榜 情侣脸 漫画脸 个人主页 私信 站内消息 今日话题 评…...

SMOTE算法解析:解决机器学习中的不平衡分类问题

1. 不平衡分类问题概述在机器学习分类任务中,我们经常会遇到类别分布严重不均衡的数据集。比如在信用卡欺诈检测中,正常交易可能占99.9%,而欺诈交易仅占0.1%。这种极端不平衡的数据分布会给模型训练带来显著挑战。传统机器学习算法通常假设数…...

从‘预测准不准’到‘模型好不好’:一个Kaggle案例带你吃透回归评估指标(含R2、RMSEP、RPD详解)

从Kaggle实战到模型评估:回归指标的全维度解析与实战应用 在数据科学领域,构建一个回归模型只是开始,真正考验功力的是如何准确评估模型表现。很多初学者会陷入一个误区——只关注预测结果是否"看起来准确",而忽略了系统…...