当前位置：首页 > article >正文

Java RAG入门基础教程（非常详细），用LangChain4j构建问答系统看这篇就够了！

article 2026/4/8 23:38:04

1. 引言为什么需要 RAG1.1 大模型的局限性在使用大语言模型LLM时我们常常遇到以下问题❌ 问题 1模型不知道企业内部信息用户我们公司的年假政策是什么AI抱歉我不知道贵公司的具体政策...❌ 问题 2模型会产生幻觉用户张三经理的联系方式是什么AI张三经理的电话是 138-xxxx-xxxx实际是编造的❌ 问题 3知识更新滞后用户公司 2024 年最新的产品价格是多少AI模型训练数据只到 2023 年无法回答1.2 RAG 的解决方案RAGRetrieval-Augmented Generation检索增强生成技术应运而生┌─────────────────────────────────────────────────────────────┐│ RAG 核心思想 │├─────────────────────────────────────────────────────────────┤│ ││ 传统 LLM用户问题 → 大模型 → 答案 ││ ││ RAG 增强用户问题 → 检索相关文档 → 问题文档 → 大模型 → 答案 ││ │└─────────────────────────────────────────────────────────────┘RAG 的优势• ✅准确可靠基于真实文档回答减少幻觉• ✅知识可更新添加新文档即可更新知识• ✅数据私有化企业数据无需上传到模型训练• ✅成本可控使用较小模型私有数据降低 API 成本1.3 为什么选择 LangChain4j框架语言特点LangChainPython/JS功能强大但需要 Python 技术栈Spring AIJavaSpring 官方出品生态整合好LangChain4jJava轻量级、API 简洁、学习曲线平缓LangChain4j 的核心理念让 Java 开发者也能像调用普通方法一样使用 AI 能力2. RAG 核心原理详解2.1 RAG 完整流程┌─────────────────────────────────────────────────────────────┐│ RAG 完整工作流程 │├─────────────────────────────────────────────────────────────┤│ ││ 【准备阶段 - 应用启动时执行】 ││ ││ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ││ │ 1. 加载 │ → │ 2. 分割 │ → │ 3. 向量化│ → │ 4. 存储 │ ││ │ 文档 │ │ 文档 │ │ Embedding│ │ 向量库 │ ││ └──────────┘ └──────────┘ └──────────┘ └──────────┘ ││ ││ 【问答阶段 - 用户提问时执行】 ││ ││ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ ││ │ 5. 用户 │ → │ 6. 检索 │ → │ 7. 构建 │ → │ 8. 生成 │ ││ │ 提问 │ │ 相关文档 │ │ 提示词 │ │ 答案 │ ││ └──────────┘ └──────────┘ └──────────┘ └──────────┘ ││ │└─────────────────────────────────────────────────────────────┘2.2 什么是向量Embedding向量是将文本转换成的数字数组语义相似的文本向量也相似。文本 → 向量简化示例实际有 1536 维公司的年假政策 → [0.12, -0.34, 0.56, 0.78, ...]年假有多少天 → [0.11, -0.33, 0.55, 0.77, ...] ← 向量很接近今天天气不错 → [0.89, 0.23, -0.67, 0.45, ...] ← 向量差别大请假流程是什么 → [0.15, -0.31, 0.52, 0.75, ...] ← 向量也很接近相似度计算余弦相似度similarity cos(θ) (A·B) / (||A|| × ||B||)结果范围-1 到 1- 1完全相同- 0无关- -1完全相反通常设定阈值 0.5-0.7低于阈值的认为不相关2.3 文档分割策略为什么需要分割• 向量模型有输入长度限制通常 512-8192 tokens• 检索时需要精确匹配相关片段而非整篇文档常用分割方法// LangChain4j 的递归分割器DocumentSplitter splitter DocumentSplitters.recursive( 500, // 每个文本块最大 500 字符 50 // 文本块之间重叠 50 字符保持上下文连贯);// 分割示例原文档2000 字符 ↓文本块 10-500 字符文本块 2450-950 字符 ← 重叠 50 字符文本块 3900-1400 字符文本块 41350-1850 字符文本块 51800-2000 字符2.4 检索与生成用户提问公司的年假政策是什么 ↓【Step 1: 问题向量化】调用 Embedding 模型 → 问题向量 [0.13, -0.32, 0.54, ...]【Step 2: 向量检索】在向量数据库中搜索相似向量- 文本块 A年假政策相似度 0.89 ✓- 文本块 B请假流程相似度 0.72 ✓- 文本块 C产品介绍相似度 0.31 ✗- 文本块 D联系方式相似度 0.28 ✗【Step 3: 构建提示词】系统你是一个智能助手请基于以下参考信息回答问题。参考信息[文本块 A 内容工作满 1 年享受 5 天带薪年假...][文本块 B 内容请假需提前 3 个工作日申请...]用户问题公司的年假政策是什么【Step 4: 调用大模型生成】qwen-max 生成答案 → 根据员工手册工作满 1 年可享受 5 天带薪年假...3. LangChain4j 框架介绍3.1 核心组件┌─────────────────────────────────────────────────────────────┐│ LangChain4j 核心组件架构 │├─────────────────────────────────────────────────────────────┤│ ││ ┌─────────────────┐ ┌─────────────────┐ ││ │ ChatLanguage │ │ Embedding │ ││ │ Model │ │ Model │ ││ │ (对话模型) │ │ (向量化模型) │ ││ └────────┬────────┘ └────────┬────────┘ ││ │ │ ││ └────────┬───────────┘ ││ │ ││ ┌────────▼────────┐ ││ │ AiServices │ ← 核心抽象层 ││ │ (AI 服务构建器) │ ││ └────────┬────────┘ ││ │ ││ ┌──────────────┼──────────────┐ ││ │ │ │ ││ ▼ ▼ ▼ ││ ┌──────┐ ┌──────────┐ ┌──────────┐ ││ │ 记忆 │ │ 检索器 │ │ 工具 │ ││ │Memory│ │Retriever │ │ Tools │ ││ └──────┘ └──────────┘ └──────────┘ ││ │└─────────────────────────────────────────────────────────────┘3.2 AiServices最强大的抽象传统 AI 调用方式RestControllerpublic class AiController { Autowired private RestTemplate restTemplate; PostMapping(/chat) public String chat(RequestBody ChatRequest request) { // 1. 手动构建提示词 String prompt 你是客服助手请基于以下信息回答\n getContext() \n 用户问题 request.getQuestion(); // 2. 调用 HTTP API HttpHeaders headers new HttpHeaders(); headers.set(Authorization, Bearer apiKey); HttpEntityMap entity new HttpEntity(...); ResponseEntityString response restTemplate.postForEntity(...); // 3. 解析结果 JsonNode root objectMapper.readTree(response.getBody()); return root.get(choices).get(0).get(message).get(content).asText(); }}LangChain4j 方式// 1. 定义接口interface Assistant { String chat(MemoryId String userId, UserMessage String question);}// 2. 创建服务Assistant assistant AiServices.builder(Assistant.class) .chatLanguageModel(model) .contentRetriever(retriever) .build();// 3. 使用像调用普通方法一样简单String answer assistant.chat(user123, 公司的年假政策是什么);3.3 支持的模型提供商LangChain4j 支持多种大模型提供商提供商模型依赖阿里云通义千问langchain4j-dashscopeOpenAIGPT-3.5/4langchain4j-open-ai百度文心一言langchain4j-qianfan本地部署Ollamalangchain4j-ollama4. 项目架构与环境搭建4.1 项目结构langchain4j-rag-demo/├── pom.xml # Maven 配置├── src/main/java/com/example/rag/│ ├── RagDemoApplication.java # 主启动类│ ├── config/│ │ ├── RagConfig.java # RAG 配置│ │ └── RagInitializer.java # RAG 初始化│ ├── service/│ │ └── AiAssistantService.java # AI 助手服务│ └── controller/│ └── AiController.java # REST API└── src/main/resources/ ├── application.yml # 配置文件 └── documents/ ├── company-policy.txt # 公司政策文档 └── product-info.txt # 产品文档4.2 核心依赖properties java.version17/java.version langchain4j.version0.29.0/langchain4j.version/propertiesdependencies !-- Spring Boot Web -- dependency groupIdorg.springframework.boot/groupId artifactIdspring-boot-starter-web/artifactId /dependency !-- LangChain4j 核心 -- dependency groupIddev.langchain4j/groupId artifactIdlangchain4j/artifactId version${langchain4j.version}/version /dependency !-- LangChain4j Spring Boot Starter -- dependency groupIddev.langchain4j/groupId artifactIdlangchain4j-spring-boot-starter/artifactId version${langchain4j.version}/version /dependency !-- LangChain4j DashScope阿里云通义千问 -- dependency groupIddev.langchain4j/groupId artifactIdlangchain4j-dashscope/artifactId version${langchain4j.version}/version /dependency/dependencies4.3 配置文件server: port: 8080spring: application: name: langchain4j-rag-demo# LangChain4j 配置langchain4j: dashscope: chat-model: api-key: ${DASHSCOPE_API_KEY:sk-xxx} model-name: qwen-max # 对话模型 temperature: 0.7 embedding-model: api-key: ${DASHSCOPE_API_KEY:sk-xxx} model-name: text-embedding-v2 # 向量化模型# 日志配置logging: level: com.example: DEBUG dev.langchain4j: DEBUG4.4 快速启动# 1. 设置 API Keyexport DASHSCOPE_API_KEYsk-your-api-key# 2. 启动项目cd langchain4j-rag-demomvn spring-boot:run# 3. 测试接口curl -G http://localhost:8080/api/ask \ --data-urlencode question公司的年假政策是什么5. 核心代码解析5.1 RAG 配置类RagConfig.javaConfigurationpublic class RagConfig { /** * 向量数据库内存版 * 生产环境可替换为PgVectorEmbeddingStore, ChromaEmbeddingStore 等 */ Bean public EmbeddingStoreTextSegment embeddingStore() { return new InMemoryEmbeddingStore(); } /** * 内容检索器 * 用于从向量数据库中检索与查询最相关的文本块 */ Bean public ContentRetriever contentRetriever( EmbeddingStoreTextSegment embeddingStore, EmbeddingModel embeddingModel) { return EmbeddingStoreContentRetriever.builder() .embeddingStore(embeddingStore) // 向量数据库 .embeddingModel(embeddingModel) // 嵌入模型 .maxResults(3) // 每次检索返回 3 个最相关结果 .minScore(0.5) // 最低相似度阈值 .build(); }}5.2 RAG 初始化器RagInitializer.javaComponentpublic class RagInitializer implements CommandLineRunner { Autowired private EmbeddingModel embeddingModel; Autowired private EmbeddingStoreTextSegment embeddingStore; Override public void run(String... args) throws Exception { log.info(开始初始化 RAG 知识库...); // Step 1: 加载文档 ListDocument documents loadDocuments(); log.info(✓ 加载了 {} 个文档, documents.size()); // Step 2: 分割文档 ListTextSegment segments splitDocuments(documents); log.info(✓ 分割成 {} 个文本块, segments.size()); // Step 3: 向量化并存储 embedAndStore(segments); log.info(✓ 向量化完成已存储到向量数据库); } private ListDocument loadDocuments() throws IOException { ListDocument documents new ArrayList(); // 加载公司政策文档 String companyPolicy loadFile(documents/company-policy.txt); if (companyPolicy ! null) { documents.add(Document.from(companyPolicy)); } // 加载产品文档 String productDoc loadFile(documents/product-info.txt); if (productDoc ! null) { documents.add(Document.from(productDoc)); } return documents; } private ListTextSegment splitDocuments(ListDocument documents) { // 创建文档分割器500 字符/块重叠 50 字符 DocumentSplitter splitter DocumentSplitters.recursive(500, 50); ListTextSegment segments new ArrayList(); for (Document document : documents) { segments.addAll(splitter.split(document)); } return segments; } private void embedAndStore(ListTextSegment segments) { for (TextSegment segment : segments) { // 调用嵌入模型将文本转换为向量 ResponseEmbedding response embeddingModel.embed(segment); Embedding embedding response.content(); // 将向量和原始文本存储到向量数据库 embeddingStore.add(embedding, segment); } }}5.3 AI 助手服务AiAssistantService.javaServicepublic class AiAssistantService { Autowired private ChatLanguageModel chatLanguageModel; Autowired private ContentRetriever contentRetriever; private Assistant assistant; private final MapString, ChatMemory userMemories new ConcurrentHashMap(); PostConstruct public void init() { // 创建 AI 助手 this.assistant AiServices.builder(Assistant.class) .chatLanguageModel(chatLanguageModel) .contentRetriever(contentRetriever) .build(); } public String ask(String userId, String question) { // 获取或创建用户记忆最多保留 10 条消息 ChatMemory memory userMemories.computeIfAbsent( userId, id - MessageWindowChatMemory.withMaxMessages(10) ); // 添加用户消息到记忆 memory.add(UserMessage.userMessage(question)); // 调用 AI 助手自动使用 RAG 检索 String response assistant.chat(userId, question); // 添加 AI 回复到记忆 memory.add(AiMessage.aiMessage(response)); return response; } // AI 助手接口定义 interface Assistant { String chat(MemoryId String userId, UserMessage String userMessage); }}5.4 REST 控制器AiController.javaRestControllerRequestMapping(/api)public class AiController { Autowired private AiAssistantService aiAssistantService; /** * 智能问答接口POST * * curl -X POST http://localhost:8080/api/ask \ * -H Content-Type: application/json \ * -d {userId: user123, question: 公司的年假政策是什么} */ PostMapping(/ask) public MapString, String ask(RequestBody AskRequest request) { String answer aiAssistantService.ask(request.getUserId(), request.getQuestion()); return Map.of(answer, answer); } /** * 简单问答接口GET * * curl -G http://localhost:8080/api/ask \ * --data-urlencode question公司的年假政策是什么 */ GetMapping(/ask) public MapString, String askGet(RequestParam String question) { String answer aiAssistantService.ask(default-user, question); return Map.of(answer, answer); } public static class AskRequest { private String userId; private String question; // getters and setters... }}5.5 完整数据流图┌─────────────────────────────────────────────────────────────────┐│ RAG 完整数据流 │├─────────────────────────────────────────────────────────────────┤│ ││ 用户请求 ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ AiController.ask() │ ││ │ - 接收 HTTP 请求 │ ││ │ - 提取 userId 和 question │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ AiAssistantService.ask() │ ││ │ - 获取用户记忆MessageWindowChatMemory │ ││ │ - 保存用户问题到记忆 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ Assistant.chat() [AiServices 代理] │ ││ │ - 触发 ContentRetriever 检索 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ ContentRetriever.retrieve() │ ││ │ 1. 调用 EmbeddingModel 将问题向量化 │ ││ │ 2. 在 EmbeddingStore 中检索 Top 3 相似文本 │ ││ │ 3. 返回相关文本块 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ 构建 RAG 提示词 │ ││ │ ┌─────────────────────────────────────────────────────┐ │ ││ │ │ 系统你是智能助手请基于参考信息回答问题 │ │ ││ │ │ │ │ ││ │ │ 参考信息 │ │ ││ │ │ [文本块 1: 工作满 1 年享受 5 天带薪年假...] │ │ ││ │ │ [文本块 2: 每增加 1 年增加 1 天上限 15 天...] │ │ ││ │ │ [文本块 3: 请假需提前 3 个工作日申请...] │ │ ││ │ │ │ │ ││ │ │ 用户问题公司的年假政策是什么 │ │ ││ │ └─────────────────────────────────────────────────────┘ │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ ChatLanguageModel.generate() │ ││ │ - 调用 qwen-max 模型 │ ││ │ - 生成答案 │ ││ └───────────────────────────────────────────────────────────┘ ││ │ ││ ▼ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ 返回答案 │ ││ │ 根据员工手册工作满 1 年可享受 5 天带薪年假每增加 1 年... │ ││ └───────────────────────────────────────────────────────────┘ ││ │└─────────────────────────────────────────────────────────────────┘6. 实际案例企业智能客服系统6.1 场景描述背景某科技公司有 200 员工HR 部门每天需要回答大量重复问题• 年假有多少天• 五险一金怎么缴纳• 公司产品有哪些• 智能客服系统多少钱需求构建一个 7x24 小时在线的智能客服自动回答员工咨询。6.2 文档准备公司政策文档company-policy.txt示例科技有限公司 - 员工手册第一章公司简介示例科技有限公司成立于 2024 年是一家专注于人工智能技术的高新技术企业。第三章员工福利1. 薪酬福利 - 具有竞争力的薪资水平 - 年终奖金1-3 个月薪资2. 社会保障 - 五险一金全额缴纳社会保险和住房公积金3. 休假制度 - 带薪年假工作满 1 年享受 5 天带薪年假每增加 1 年增加 1 天上限 15 天 - 带薪病假每年 5 天带薪病假4. 工作时间 - 弹性工作早上 9-10 点弹性打卡 - 周末双休产品文档product-info.txt示例科技 - 产品信息文档产品一智能客服系统 (SmartCS)价格方案- 基础版9999 元/年1000 次/天- 专业版29999 元/年5000 次/天- 企业版99999 元/年不限次数产品二文档助手 (DocHelper)价格方案- 基础版4999 元/年10GB 存储- 专业版14999 元/年100GB 存储- 企业版49999 元/年不限存储6.3 接口测试# 单轮问答测试 # 测试 1年假政策curl -G http://localhost:8080/api/ask \ --data-urlencode question公司的年假政策是什么# 预期输出# {# answer: 根据示例科技有限公司的员工手册公司的年假政策如下# - 工作满 1 年的员工可以享受 5 天带薪年假# - 每增加 1 年工龄年假天数增加 1 天# - 年假天数上限为 15 天# }# 测试 2产品价格curl -G http://localhost:8080/api/ask \ --data-urlencode question智能客服系统多少钱一年# 预期输出# {# answer: 根据产品信息文档智能客服系统 (SmartCS) 的价格方案如下# - 基础版9999 元/年支持每天 1000 次交互# - 专业版29999 元/年支持每天 5000 次交互# - 企业版99999 元/年不限每日交互次数# }# 测试 3工作时间curl -G http://localhost:8080/api/ask \ --data-urlencode question# 预期输出# {# answer: 公司实行弹性工作制# - 上班时间早上 9-10 点弹性打卡# - 周末双休# - 不鼓励加班# }# 多轮对话测试 # 第一轮询问产品功能curl -X POST http://localhost:8080/api/ask \ -H Content-Type: application/json \ -d { userId: user-001, question: 智能客服系统有什么功能 }# 第二轮追问价格AI 会记住上下文curl -X POST http://localhost:8080/api/ask \ -H Content-Type: application/json \ -d { userId: user-001, question: 那专业版多少钱 }# 第三轮继续追问curl -X POST http://localhost:8080/api/ask \ -H Content-Type: application/json \ -d { userId: user-001, question: 有售后服务吗 }6.4 前端集成示例Vue 3 前端组件template div classchat-container div classmessages div v-formsg in messages :keymsg.id :class[message, msg.role] div classcontent{{ msg.content }}/div /div /div div classinput-area input v-modelinputMessage keyup.entersendMessage placeholder输入问题... / button clicksendMessage发送/button /div /div/templatescript setupimport { ref } from vueconst messages ref([])const inputMessage ref()const userId ref(user- Date.now())async function sendMessage() { if (!inputMessage.value.trim()) return // 添加用户消息 messages.value.push({ id: Date.now(), role: user, content: inputMessage.value }) // 调用 API const response await fetch(/api/ask, { method: POST, headers: { Content-Type: application/json }, body: JSON.stringify({ userId: userId.value, question: inputMessage.value }) }) const data await response.json() // 添加 AI 回复 messages.value.push({ id: Date.now() 1, role: assistant, content: data.answer }) inputMessage.value }/script7. 生产环境升级方案7.1 替换向量数据库从内存版升级到 PostgreSQL pgvectorConfigurationpublic class ProductionRagConfig { Bean public EmbeddingStoreTextSegment embeddingStore(DataSource dataSource) { return PgVectorEmbeddingStore.builder() .dataSource(dataSource) .tableName(document_embeddings) .dimension(1536) // text-embedding-v2 的维度 .createTable(true) .dropTableFirst(false) .build(); }}使用 ChromaDBBeanpublic EmbeddingStoreTextSegment embeddingStore() { return ChromaEmbeddingStore.builder() .baseUrl(http://localhost:8000) .collectionName(company-knowledge) .build();}使用 RedisBeanpublic EmbeddingStoreTextSegment embeddingStore() { return RedisEmbeddingStore.builder() .host(localhost) .port(6379) .indexName(rag-embeddings) .dimension(1536) .build();}7.2 支持更多文档格式Componentpublic class DocumentLoader { /** * 加载 PDF 文档 */ public Document loadPdf(String path) { return PdfDocumentLoader.from(path); } /** * 加载 Word 文档 */ public Document loadWord(String path) { return WordDocumentLoader.from(path); } /** * 加载网页 */ public Document loadWeb(String url) { return JsoupDocumentLoader.from(url); } /** * 批量加载目录下的所有文档 */ public ListDocument loadDirectory(String dirPath) { ListDocument documents new ArrayList(); Path dir Path.of(dirPath); try (var stream Files.walk(dir)) { stream.filter(Files::isRegularFile) .forEach(path - { try { String ext path.toString().toLowerCase(); if (ext.endsWith(.pdf)) { documents.add(PdfDocumentLoader.from(path.toString())); } else if (ext.endsWith(.docx)) { documents.add(WordDocumentLoader.from(path.toString())); } else if (ext.endsWith(.txt)) { documents.add(TextDocumentLoader.from(path.toString())); } } catch (IOException e) { log.warn(加载文件失败{}, path, e); } }); } catch (IOException e) { throw new RuntimeException(e); } return documents; }}7.3 添加 Agent 工具调用让 AI 能够调用外部 API如天气、计算器等Servicepublic class WeatherAgent { Tool(查询指定城市的天气) public String getWeather(P(城市名称) String city) { // 调用天气 API return 北京晴25°C东南风 2 级; } Tool(计算数学表达式) public double calculate(P(数学表达式) String expression) { // 使用脚本引擎计算 ScriptEngine engine new ScriptEngineManager() .getEngineByName(JavaScript); try { return ((Number) engine.eval(expression)).doubleValue(); } catch (ScriptException e) { return 0; } }}// 注册工具Servicepublic class AiAssistantService { Autowired private WeatherAgent weatherAgent; PostConstruct public void init() { this.assistant AiServices.builder(Assistant.class) .chatLanguageModel(chatLanguageModel) .contentRetriever(contentRetriever) .tools(weatherAgent) // 注册工具 .build(); }}// 使用// 用户问北京今天天气怎么样25 度加 10 度等于多少// AI 会自动调用 getWeather(北京) 和 calculate(2510)7.4 添加监控和日志Componentpublic class RagMetrics { private final MeterRegistry meterRegistry; private final Counter questionCounter; private final Timer responseTimer; public RagMetrics(MeterRegistry meterRegistry) { this.meterRegistry meterRegistry; this.questionCounter meterRegistry.counter(rag.questions.total); this.responseTimer meterRegistry.timer(rag.response.time); } public void recordQuestion() { questionCounter.increment(); } public T T recordResponse(SupplierT supplier) { return responseTimer.record(supplier); }}// 在 Service 中使用Servicepublic class AiAssistantService { Autowired private RagMetrics metrics; public String ask(String userId, String question) { metrics.recordQuestion(); return metrics.recordResponse(() - { // ... 原有逻辑 }); }}7.5 生产配置示例# application-prod.ymlserver: port: 8080spring: datasource: url: jdbc:postgresql://localhost:5432/rag_db username: rag_user password: ${DB_PASSWORD}langchain4j: dashscope: chat-model: api-key: ${DASHSCOPE_API_KEY} model-name: qwen-max temperature: 0.7 max-tokens: 2000 embedding-model: api-key: ${DASHSCOPE_API_KEY} model-name: text-embedding-v2# 连接池配置langchain4j: dashscope: connect-timeout: 30000 read-timeout: 60000# 日志配置logging: level: dev.langchain4j: INFO pattern: console: %d{yyyy-MM-dd HH:mm:ss} [%thread] %-5level %logger{36} - %msg%n8. 总结与最佳实践8.1 学习路线回顾阶段内容关键代码理解 RAG检索增强生成原理问题→检索→增强→生成向量基础Embedding 向量化embeddingModel.embed(text)文档处理加载与分割DocumentSplitters.recursive(500, 50)向量存储存储与检索EmbeddingStore.add(),retrieve()AI 服务AiServices 抽象AiServices.builder().build()多轮对话记忆管理MessageWindowChatMemory8.2 最佳实践建议1. 文档分割策略推荐配置- 文本块大小300-800 字符- 重叠字符数30-100 字符- 按段落/句子边界分割2. 检索参数调优推荐配置- maxResults: 3-5返回结果数量- minScore: 0.5-0.7相似度阈值- 阈值过高会漏掉相关信息过低会引入噪声3. 提示词设计好的 RAG 提示词应包含- 明确的角色设定- 清晰的回答规则- 参考信息的明确标识- 处理不知道的情况4. 成本控制- 使用较小的嵌入模型text-embedding-v2- 合理设置 max-tokens 限制- 对常见问题使用缓存- 批量处理文档向量化8.3 常见问题与解决方案问题原因解决方案回答不准确检索结果不相关调整 minScore 阈值优化文档分割回答太简短提示词约束不足在系统提示词中要求详细回答响应速度慢向量检索慢使用向量数据库索引如 pgvector多轮对话丢失上下文记忆配置问题检查 MessageWindowChatMemory 配置学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Java RAG入门基础教程（非常详细），用LangChain4j构建问答系统看这篇就够了！

相关文章：

Java RAG入门基础教程（非常详细），用LangChain4j构建问答系统看这篇就够了！

C语言学习的第一周

简易数据采集与分析系统

CSS如何利用Less快速生成颜色渐变背景_使用混合函数生成多样渐变

别再让图片拖慢你的多模态模型了：手把手教你用Q-Former和PruMerge压缩视觉Token（附代码）

深入解析MCU：从哈佛架构到智能家居应用

微信聊天记录导出终极指南：如何快速安全备份你的珍贵回忆

HsMod：革新性炉石传说增强工具，全方位提升游戏体验

Linux学习进展计算机基本硬件结构

Excel文件压缩难？这4个方法让文件秒变小，传输再也不卡壳！

基于springboot+vue高校物资信息采购系统hx0807

【2026春招必看】MiniMax大模型算法岗面试深度解析：薪资福利+核心考点+项目经验！手把手教你冲刺高薪Offer！

十大AI写作工具迎来深度评测，AIGC论文助手从功能性、稳定性等维度出发，量化分析其核心表现。

5分钟搞懂LLM、Token、Agent，解锁AI核心价值！

MTK平台Camera移植避坑指南：从驱动添加到DWS配置的完整流程（基于Kernel 4.19）

从LLM到A2A：AI工程师必备7大核心概念解析，掌握AI未来！

5分钟上手libhv：用自带httpd和curl工具快速搭建本地测试服务

Python 办公自动化封神篇：PDF+Word 全自动处理，从此告别复制粘贴！

数字后端 | Innovus 中解决 Congestion 的常用方法

Polars 2.0大规模清洗踩坑实录：3类隐性OOM陷阱+4步零拷贝修复法，DBA紧急封存的内部手册

Python程序员最后的护城河：掌握无GIL环境下的内存序建模、seq_cst原子操作与TSO一致性验证（附GCC/Clang内联汇编对照表）

Docker镜像拉取超时？5分钟搞定国内镜像源加速配置（附最新可用镜像列表）

eNSP启动AR报错码40终极排查指南：从Hyper-V冲突到虚拟网卡修复

双轴卷取分切机程序，PLC和触摸屏使用西门子smart200系列。前后卷取双轴张力控制计算

小红书合规引流新姿势：聚光平台落地页卡片制作全流程指南

【信息科学与工程学】【管理科学】第十六篇利益设计与分配：从静态薪酬到动态激励生态系统的工程化重构

Aseprite新手必看：5分钟搞定像素角色基础动画（附完整工程文件）

从原理到实战：LRU缓存算法的核心机制与工程实践

别再只靠瓦片等级了！用Cesium精准控制地图缩放的自定义比例尺方案

Keploy实战：基于真实流量的API自动化测试与Mock生成