当前位置：首页 > news >正文

『大模型笔记』RAG应用的12种调优策略指南

news 2026/4/14 10:17:37

RAG应用的12种调优策略指南

文章目录

一. 概要
二. 数据索引
- 2.1. 数据清洗
- 2.2. 分块
- 2.3. 嵌入模型
- 2.4. 元数据（或未向量化的数据）
- 2.5. 多索引
- 2.6. 索引算法
三. 推理阶段（检索和生成）
- 3.1. 检索参数
- 3.2. 高级检索策略
- 3.3. 重新排序模型
- 3.5. 大语言模型（LLM）

『大模型笔记』RAG应用的12种调优策略指南

RAG应用的12种调优策略指南文章目录一. 概要二. 数据索引2.1. 数据清洗2.2. 分块2.3. 嵌入模型2.4. 元数据（或未向量化的数据）2.5. 多索引2.6. 索引算法三. 推理阶段（检索和生成）3.1. 检索参数3.2. 高级检索策略3.3. 重新排序模型3.5. 大语言模型（LLM）...

编程日记 2024/3/2 5:20:13

23 文章讲解力扣地址 C class Solution { public:void reverseString(vector<char>& s) {int left 0;int right s.size() - 1; // right 应该初始化为 s.size() - 1while (left < right) {swap(s[left], s[right]); // 直接交换 s[left] 和 s[right] 的值lef…...

编程日记 2024/3/2 5:18:11

【蓝桥杯省赛真题31】python连续正整数之和中小学青少年组蓝桥杯比赛python编程省赛真题解析

目录 python连续正整数之和一、题目要求 1、编程实现 2、输入输出二、算法分析三、程序编写四、程序说明五、运行结果六、考点分析七、推荐资料 1、蓝桥杯比赛 2、考级资料 3、其它资料 python连续正整数之和第十二届蓝桥杯青少年组python比赛省赛真题 …...

编程日记 2024/3/2 5:15:09

【116个】网络安全测试相关面试真题

1、Burpsuite常用的功能是什么？ 2、reverse_tcp和bind_tcp的区别？ 3、拿到一个待检测的站或给你一个网站，你觉得应该先做什么？ 4、你在渗透测试过程中是如何敏感信息收集的？ 5、你平时去哪些网站进行学习、挖漏洞提…...

编程日记 2024/3/2 5:13:07

微服务day02-Ribbon负载均衡与Nacos安装与入门

一.Ribbon负载均衡在上一节中，我们通过在RestTemplte实例中加上了注解 LoadBalanced,表示将来由RestTemplate发起的请求会被Ribbon拦截和处理，实现了访问服务时的负载均衡，那么他是如何实现的呢？ 1.1 Ribbon负载均衡的原理 Rib…...

编程日记 2024/3/2 5:12:06

深度学习-神经网络原理

文章目录神经网络原理1.单层神经网络1.1 回归单层神经网络：线性回归1.2 二分类单层神经网络：sigmoid与阶跃函数 1.3 多分类单层神经网络：softmax回归神经网络原理人工神经网络（Artificial Neural Network，ANN&…...

编程日记 2024/3/2 5:10:04

Chat GPT：智能对话的下一步

Chat GPT：智能对话的下一步介绍 Chat GPT（Generative Pre-trained Transformer）是一种基于Transformer架构的强大对话模型，可以产生自然流畅的回答，并实现人机对话的感觉。本文将探讨Chat GPT在智能对话领域的影响和…...

编程日记 2024/3/2 5:09:03

[数据集][目标检测]鸡蛋破蛋数据集VOC+YOLO格式792张2类别

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)：792 标注数量(xml文件个数)：792 标注数量(txt文件个数)：792 标注类别…...

编程日记 2024/3/2 5:08:02

RabbitMQ实战学习

RabbitMQ实战学习文章目录 RabbitMQ实战学习RabbitMQ常用资料1、安装教程2、使用安装包3、常用命令4、验证访问5、代码示例一、RabbitMQ基本概念1.1. MQ概述1.2 MQ 的优势和劣势1.3 MQ 的优势1. 应用解耦2. 异步提速3. 削峰填谷 1.4 MQ 的劣势1.5 RabbitMQ 基础架构1.6 JMS 二…...

编程日记 2024/3/2 5:06:01

插混、油混、增程式、轻混、强混，啥区别

这里写自定义目录标题随着我国新能源汽车的大力推进，电车可以说是世界未来的主流，只不过现在是处在一个过渡时代这是个好时代，因为我们见证并体验着历史过渡的细节这是个不好的时代，因为我们可能只是未来新新人类的试验品帮他…...

编程日记 2024/3/2 5:03:59

React 模态框的设计（八）优化补充

在之前的弹窗的设计中，有两处地方现在做一点小小的优化，就是把_Draggable.jsx中的 onPointerEnter 事件用 useLayoutEffect来规换，效果更佳，同样的，在_ModelContainer.jsx中也是一样。如下所示： _Draggabl…...

编程日记 2024/3/2 5:02:58

知识积累（三）：深度学习相关概念（查看检索时看到）

文章目录 1. 知识蒸馏2. 可微搜索索引（DSI）参考资料在找论文时，发现的相关概念。 1. 知识蒸馏知识蒸馏（knowledge distillation）是模型压缩的一种常用的方法，不同于模型压缩中的剪枝和量化，知…...

编程日记 2024/3/2 5:01:56

计算机专业必看的几部电影

目录编辑 1. 《第九区》（District 9，2009） 2. 《谍影重重》（The Bourne Identity，2002） 3. 《源代码》（Source Code，2011） 4. 《她》（Her，…...

编程日记 2024/3/2 4:56:52

工业人工智能需要注意的10件事

我们无法逃避人工智能这个风口，宣传人工智能软件的广告铺天盖地，似乎每个供应商都在推出最新的工具包，每天都有关于 ChatGPT、Bard 等新用例的文章。似乎全世界都在说：你现在需要人工智能！ 人工智能确实正在成为自动化…...

编程日记 2024/3/2 4:54:50

软考-系统集成项目管理中级-信息系统建设与设计

本章重点考点 1.信息系统的生命周期信息系统建设的内容主要包括设备采购、系统集成、软件开发和运维服务等。信息系统的生命周期可以分为四个阶段:立项、开发、运维和消亡。 2.信息系统开发方法信息系统常用的开发方法有结构化方法、原型法、面向对象方法等 1)结构化方法 …...

编程日记 2024/3/2 4:53:50

C++从零开始的打怪升级之路(day39)

这是关于一个普通双非本科大一学生的C的学习记录贴在此前，我学了一点点C语言还有简单的数据结构，如果有小伙伴想和我一起学习的，可以私信我交流分享学习资料那么开启正题今天分享的是关于模板的知识点 1.非类型模板参数模板参数分为…...

编程日记 2024/3/2 4:52:49

Java面试题之并发

并发 1.并发编程的优缺点？2.并发编程三要素？3.什么叫指令重排？4.如何避免指令重排？5.并发？并行？串行？6.线程和进程的概念和区别？7.什么是上下文切换？8.守护线程和用户线程的定义？9.什么是线程死锁？10.形成死锁的四个条件？11.怎么避免死锁？12.创建线程的四种方式？…...

编程日记 2024/3/2 4:49:46

Python GUI自动化定位代码参考

一、pyautogui原始逻辑 import pyautogui # 获取指定图片在屏幕上的位置 image_path path/to/image.png target_position pyautogui.locateCenterOnScreen(image_path) if target_position is not None: # 获取偏移量 offset_x 10 offset_y 10 # 计算实际点…...

编程日记 2024/3/2 4:48:45

11.网络游戏逆向分析与漏洞攻防-游戏网络架构逆向分析-接管游戏接收网络数据包的操作

内容参考于：易道云信息技术研究院VIP课上一个内容：接管游戏发送数据的操作码云地址（master 分支）：https://gitee.com/dye_your_fingers/titan 码云版本号：8256eb53e8c16281bc1a29cb8d26d352bb5bbf4c 代…...

编程日记 2024/3/2 4:45:42

特斯拉一面算法原题

来自太空的 X 帖子埃隆马斯克（Elon Musk）旗下太空探索技术公司 SpaceX 于 2 月 26 号，从太空往社交平台 X（前身为推特，已被马斯克全资收购并改名）发布帖子。这是 SpaceX 官号首次通过星链来发送 X 帖子&a…...

编程日记 2024/3/2 4:42:40

GitHub中文界面终极指南：3分钟让GitHub全面中文化的完整教程

GitHub中文界面终极指南：3分钟让GitHub全面中文化的完整教程【免费下载链接】github-chinese GitHub 汉化插件，GitHub 中文化界面。 (GitHub Translation To Chinese) 项目地址: https://gitcode.com/gh_mirrors/gi/github-chinese 你是否曾经因…...

编程新知 2026/4/14 10:10:34

轻量级AI助手开发：基于通义千问1.8B的智能问答系统搭建

轻量级AI助手开发：基于通义千问1.8B的智能问答系统搭建 1. 项目概述与核心价值在AI应用开发领域，如何在资源受限环境下部署高效的智能问答系统一直是开发者面临的挑战。通义千问1.5-1.8B-Chat-GPTQ-Int4模型通过量化压缩技术，在保持良好对…...

编程新知 2026/4/14 9:42:12

CV算法面试必问：30道深度学习真题详解

CV算法面试必问：30道深度学习真题详解params_grad evaluate_gradient(loss_function, data, params)params params - learning_rate * params_grad优点：（1）一次迭代是对所有样本进行计算，此时利用矩阵进行操作&#…...

编程新知 2026/4/14 9:05:35

BKIN 完整链路评估

BKIN 完整链路评估（基于当前代码） 1. 结论摘要当前工程已形成“硬件秒级切断 + 软件锁存 + 状态机收敛”的 BKIN 保护闭环。硬件链路由 TIM0 BKIN 直接触发 BRK，会在硬件侧优先拉低主输出使能（MOE 关闭），具备最高优先级。软件链路通过 TIMER0_BRK_IRQHandler 和 prot…...

编程新知 2026/4/14 8:25:07

大模型---模型的后训练

目录 1.继续训练 2.SFT 3.对齐训练这篇文章会讲三种不同的后训练方式：继续训练，SFT，对齐训练，这里先总体说一下。Dont Stop Pretraining把继续训练定义为多阶段自适应预训练，并证明在目标领域语料和任务相关无标注语料上继续预训练，通常能提升下游表现；SFT在对齐训练…...

编程新知 2026/4/14 7:39:23