当前位置：首页 > news >正文

基于大模型LLM 应用方案

news 2026/2/8 17:46:29

现如今LLM 应用面临的主要问题

准确性，2. 高成本，3. 专业性，4. 时效性，5. 安全性

信息偏差/幻觉 (大模型由于数据缺陷/知识边界会使用可靠性下降)
知识更新滞后性（LLM 基于静态数据集训练，可能导致知识更新滞后，无法及时反映最新信息动态。）
内容不可追溯：（LLM 生成的内容往往缺乏明确的信息来源，影响内容的可信度。）
推理能力限制：（LLM 可能缺乏必要的推理能力）
长文本处理能力较弱：（受限于有限的上下文窗口，处理速度随着输入长度增加而减慢）

主流方案

无训练成本

直接使用已经训练好的预训练模型，不需要额外训练，

1. 只通过输入或微调提示（Prompt Engineering）实现功能。

System Prompt + ICL（In-Context Learning）在 Prompt 中提供示例，模型基于示例进行推理+ CoT（Chain of Thought）通过推理链分步引导，模型逐步推理以提高复杂问题的解决能力：
提供明确的上下文和示例，指导模型分步骤推理，增强回答质量。

2. 限定回答范围（Guidance）：通过明确的指令限制模型输出格式和范围。

3. Retrieval Augmented Generation (RAG)通过检索外部知识，补充模型的生成能力。

langchain

基于检索返回的内容做Prompt增强
当前完整的 RAG 应用流程主要包含两个阶段：
- 数据准备阶段：数据提取——>文本分割——>向量化（embedding）——>数据入库
- 应用阶段：用户提问——>数据检索（召回）——>注入 Prompt——>LLM 生成答案
Bing-like 模式
结合全网搜索结果，增强模型的知识范围调用通用搜索引擎（如 Bing、Google）。调用通用搜索引擎（如 Bing、Google）。

Perplexity.ai

Google Search Labs

4. Function Call + Plugins 通过外部工具（如函数调用、插件）扩展模型能力。

Function calling

5. Ensemble/Bagging 通过多次调用模型，使用不同提示或结果整合，提升回答的质量和一致性。

Med-PaLM 2

CoT-SC（Self-Consistency）：对一个问题生成多个答案，投票选出最佳答案。
Prompt Bagging：使用多个设计不同的 Prompt 输入，结合结果进行优化。
Ensemble Refinement：利用多个模型分别生成答案，最后组合成最终输出。

6.Reflection/System2 像人类一样非线性思考问题、reasoning、planning

ReAct、ToT

有训练成本

1. SFT（Supervised Fine-Tuning）通过监督微调对模型进行对齐（Alignment）

Full FT（全模型微调）：调整整个模型参数，适合大规模定制。
PEFT（Parameter-Efficient Fine-Tuning）：只调整部分参数（如 LoRA），资源友好。

具体方案

准备标注数据集。
选择微调方法：
- 全模型微调（Full Fine-tuning）。
- 参数高效微调（PEFT），如 LoRA。
使用分布式训练框架（如 Hugging Face Trainer）进行训练。

2. 增量预训练（Incremental Pretraining）增量预训练（Incremental Pretraining）

在特定领域数据上继续预训练模型，增强领域能力。 MOE

3. MOE（Mixture of Experts）MOE（Mixture of Experts）

通过动态激活模型的部分模块，提升大模型的训练效率和推理能力。好的数据配比、数据质量、训练技巧、训练资源。

总结建议

如果需要快速实现功能、资源有限，优先选择无训练成本方案，如：
- 使用 Prompt Engineering（ICL + CoT）改进回答质量。
- 结合检索增强模型（RAG）。
- 借助 Function Call 和 Plugin 扩展功能。
如果追求高精度、领域定制化或长期优化，选择有训练成本方案，如：
- 使用 SFT 对齐模型输出格式。
- 在特定领域内增量预训练或全面预训练新模型。

选择具体实现方案需根据应用场景、技术资源和业务需求综合评估。

基于大模型LLM 应用方案

现如今LLM 应用面临的主要问题准确性，2. 高成本，3. 专业性，4. 时效性，5. 安全性信息偏差/幻觉 (大模型由于数据缺陷/知识边界会使用可靠性下降)知识更新滞后性 （LLM 基于静态数据集训练，可能导致知识更…...

编程日记 2024/12/29 5:46:51

实用技巧：关于 AD修改原理图库如何同步更新到有原理图的解决方法

若该文为原创文章，转载请注明原文出处本文章博客地址：https://hpzwl.blog.csdn.net/article/details/144738332 长沙红胖子Qt（长沙创微智科）博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV…...

编程日记 2024/12/29 5:42:47

区块链平台安全属性解释

区块链平台安全属性解释双向认证解释：双向认证是指在通信过程中，**通信双方都需要对对方的身份进行验证，确保对方是合法的、可信任的实体。**只有双方身份都得到确认后，通信才会被允许进行，从而防止非法用户的接入和数据的窃取或篡改。举例：在基于区块链和联邦学习的数…...

编程日记 2024/12/29 5:41:46

思维导图作业 TCP的cs模型服务器 //服务器 #include <myhead.h> #define PORT 6667 #define IP "192.168.124.94" #define BACKLOG 128 int main(int argc, const char *argv[]) {//创建套接字int oldfd socket(AF_INET,SOCK_STREAM,0);if(oldfd-1){perro…...

编程日记 2024/12/29 5:39:40

Machine-learning the skill of mutual fund managers

Machine-learning the skill of mutual fund managers – 论文阅读文章目录 Machine-learning the skill of mutual fund managers -- 论文阅读AbstractIntroductionQuestionMain findingscontributionsliterature reviewDataSampleHoldings-based characteristicsModelOptima…...

编程日记 2024/12/29 5:37:37

Windows下Python+PyCharm的安装步骤及PyCharm的使用

Windows下PythonPyCharm的安装步骤及PyCharm的使用文章目录 Windows下PythonPyCharm的安装步骤及PyCharm的使用一、Python的安装（1）环境准备（2）Python安装（3）pip组件的安装二、PyCharm的安装（…...

编程日记 2024/12/29 5:36:36

Anaconda＋PyTorch（CPU版）安装

1.Anaconda下载 Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 如果已安装python，下载之前要彻底删除之前下载的python 2.Anaconda安装 3.添加环境变量 //根据实际安装路径进行更改 D:\Anaconda D:\Anaconda\Scripts D:\…...

编程日记 2024/12/29 5:35:35

第 28 章 - ES 源码篇 - Elasticsearch 启动与插件加载机制解析

前言不管是什么框架，启动类里面做的一定是初始化的工作！ 启动 ES 节点的启动逻辑，全部都在 org.elasticsearch.bootstrap 包下。启动类为：Elasticsearch#main(final String[] args) 与大多数框架启动类一致。启动类主要负责的…...

编程日记 2024/12/29 5:32:32

机床数据采集网关在某机械制造企业的应用

随着工业4.0时代的到来，智能制造已成为制造业转型升级的重要方向。数控机床作为现代制造业的核心设备，其运行状态和加工参数的数据实时采集与分析对于提升生产效率、优化生产流程具有关键意义。背景概述某机械制造企业拥有多台数控机床，这…...

编程日记 2024/12/29 5:31:31

美团Android开发200道面试题及参考答案（上）

http 三次握手 / 四次挥手具体过程，信号量的变化，只有两次握手行不行三次握手过程：第一次握手：客户端向服务器发送一个 SYN（同步）标志位为 1 的 TCP 报文段，其中包含客户端的初始序列号（ISN），此时客户端进入 SYN_SENT 状态，表示客户端请求建立连接。第二次握手：服…...

编程日记 2024/12/29 5:30:30

MQTT协议的应用场景及特点和常见的概念03

发布者发送数据---》代理软件Broker---》订阅者接收数据发布者和订阅者进行隔离 1.空间上的隔离 2.时间上的隔离 MQTT常见的应用场景：物联网行业 MQTT常见的特点: 1.轻量级：MQTT协议占用的系统资源较少，数据报文较小 2.可靠性较强&#xff1…...

编程日记 2024/12/29 5:29:27

电脑缺失sxs.dll文件要怎么解决？

一、文件丢失问题：以sxs.dll文件缺失为例当你在运行某个程序时，如果系统提示“找不到sxs.dll文件”，这意味着你的系统中缺少了一个名为sxs.dll的动态链接库文件。sxs.dll文件通常与Microsoft的.NET Framework相关，是许多应用程序…...

编程日记 2024/12/29 5:26:23

数据处的存储与处理——添加数组

Numpy模块中的append()函数和insert()函数 1、append()函数的使用 append(arr,values,axisNone) arr 必选，要添加元素的数组 values 必选，要添加的元素数组 axis 可选，默认值为None。当省略该参数时，表示在…...

编程日记 2024/12/29 5:24:20

24-12-28-pytorch深度学习CUDA的GPU加速环境配置步骤

文章目录 pytorch深度学习CUDA的GPU加速环境配置步骤1. 更新cuda驱动2. 更新完成cuda驱动后，查看对应的驱动版本3. 根据驱动的版本号，下载对应的cuda-toolkit4. CUDA是否配置成功5. 配置CUDNN6. 配置torch pytorch深度学习CUDA的GPU加速环境配置步骤 1.…...

编程日记 2024/12/29 5:23:18

YOLO系列正传（五）YOLOv4论文精解（上）：从CSPNet、SPP、PANet到CSPDarknet-53

系列文章 YOLO系列基础 YOLO系列基础合集——小白也看得懂的论文精解-CSDN博客 YOLO系列正传 YOLO系列正传（一）类别损失与MSE损失函数、交叉熵损失函数-CSDN博客 YOLO系列正传（二）YOLOv3论文精解(上)——从FPN到darknet-53-C…...

编程日记 2024/12/29 5:21:13

【AIGC-ChatGPT副业提示词指令 - 动图】魔法咖啡馆：一个融合创意与治愈的互动体验设计

引言在当今快节奏的生活中，咖啡早已不仅仅是提神醒脑的饮品，更成为了一种情感寄托和生活态度的表达。本文将介绍一个独特的"魔法咖啡馆"互动体验设计，通过将咖啡与情感、魔法元素相结合，创造出一个充满想象力和治愈感…...

编程日记 2024/12/29 5:20:11

AIGC在电影与影视制作中的应用：提高创作效率与创意的无限可能

云边有个稻草人-CSDN博客目录引言一、AIGC在剧本创作中的应用 1.1 剧本创作的传统模式与挑战 1.2 AIGC如何协助剧本创作 1.3 未来的剧本创作：AI辅助的协同创作二、AIGC在角色设计中的应用 2.1 传统角色设计的挑战 2.2 AIGC如何协助角色设计三、AIGC在…...

编程日记 2024/12/29 5:18:08

第三百四十六节 JavaFX教程 - JavaFX绑定

JavaFX教程 - JavaFX绑定 JavaFX绑定同步两个值：当因变量更改时，其他变量更改。要将属性绑定到另一个属性，请调用bind()方法，该方法在一个方向绑定值。例如，当属性A绑定到属性B时，属性B的更改将更新属性A…...

编程日记 2024/12/29 5:15:02

IDEA+Docker一键部署项目SpringBoot项目

文章目录 1. 部署项目的传统方式2. 前置工作3. SSH配置4. 连接Docker守护进程5. 创建简单的SpringBoot应用程序6. 编写Dockerfile文件7. 配置远程部署 7.1 创建配置7.2 绑定端口7.3 添加执行前要运行的任务 8. 部署项目9. 开放防火墙的 11020 端口10. 访问项目11. 可能遇到的问…...

编程日记 2024/12/29 5:13:00

vue Promise使用

new Promise((resolve, reject) > { ... }) 是 JavaScript 中创建 Promise 实例的语法。Promise 是一种用于处理异步操作的对象，它代表了一个异步操作的最终完成（或失败）及其结果值。 Promise 的基本结构 javascript 深色版本 const my…...

编程日记 2024/12/29 5:11:58

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

编程新知 2026/2/4 17:44:58

＜6＞-MySQL表的增删查改

目录一，create（创建表） 二，retrieve（查询表） 1，select列 2，where条件三，update（更新表） 四，delete（删除表&#xf…...

编程新知 2025/12/11 18:28:17

Swift 协议扩展精进之路：解决 CoreData 托管实体子类的类型不匹配问题（下）

概述在 Swift 开发语言中，各位秃头小码农们可以充分利用语法本身所带来的便利去劈荆斩棘。我们还可以恣意利用泛型、协议关联类型和协议扩展来进一步简化和优化我们复杂的代码需求。不过，在涉及到多个子类派生于基类进行多态模拟的场景下，…...

编程新知 2026/1/23 4:56:05

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

服务端执行命令请求的过程【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

编程新知 2026/2/2 0:45:02

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

编程新知 2026/1/26 21:57:45

【SQL学习笔记1】增删改查+多表连接全解析（内附SQL免费在线练习工具）

可以使用Sqliteviz这个网站免费编写sql语句，它能够让用户直接在浏览器内练习SQL的语法，不需要安装任何软件。链接如下： sqliteviz 注意： 在转写SQL语法时，关键字之间有一个特定的顺序，这个顺序会影响到…...

编程新知 2026/2/5 4:36:53

CMake控制VS2022项目文件分组

我们可以通过 CMake 控制源文件的组织结构，使它们在 VS 解决方案资源管理器中以“组”（Filter）的形式进行分类展示。 🎯 目标通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总（共4种）方法描述是否推荐…...

编程新知 2025/12/4 15:47:17