当前位置: 首页 > news >正文

基于大模型LLM 应用方案

现如今LLM 应用 面临的主要问题

  1. 准确性,2. 高成本,3. 专业性,4. 时效性,5. 安全性
  • 信息偏差/幻觉 (大模型由于数据缺陷/知识边界 会使用 可靠性下降)
  • 知识更新滞后性 (LLM 基于静态数据集训练,可能导致知识更新滞后,无法及时反映最新信息动态。)
  • 内容不可追溯: (LLM 生成的内容往往缺乏明确的信息来源,影响内容的可信度。)
  • 推理能力限制:(LLM 可能缺乏必要的推理能力)
  • 长文本处理能力较弱:(受限于有限的上下文窗口,处理速度随着输入长度增加而减慢)

主流方案

无训练成本

直接使用已经训练好的预训练模型,不需要额外训练,

1. 只通过输入或微调提示(Prompt Engineering)实现功能。

System Prompt + ICL(In-Context Learning)在 Prompt 中提供示例,模型基于示例进行推理+ CoT(Chain of Thought)通过推理链 分步引导,模型逐步推理以提高复杂问题的解决能力:
提供明确的上下文和示例,指导模型分步骤推理,增强回答质量。

2. 限定回答范围(Guidance):通过明确的指令限制模型输出格式和范围。
3. Retrieval Augmented Generation (RAG)通过检索外部知识,补充模型的生成能力。

langchain

  • 基于检索返回的内容做Prompt增强
    当前完整的 RAG 应用流程主要包含两个阶段:
    • 数据准备阶段:数据提取——>文本分割——>向量化(embedding)——>数据入库

    • 应用阶段:用户提问——>数据检索(召回)——>注入 Prompt——>LLM 生成答案

  • Bing-like 模式
    结合全网搜索结果,增强模型的知识范围 调用通用搜索引擎(如 Bing、Google)。调用通用搜索引擎(如 Bing、Google)。

Perplexity.ai

Google Search Labs

4. Function Call + Plugins 通过外部工具(如函数调用、插件)扩展模型能力。

Function calling

5. Ensemble/Bagging 通过多次调用模型,使用不同提示或结果整合,提升回答的质量和一致性。

Med-PaLM 2

  • CoT-SC(Self-Consistency):对一个问题生成多个答案,投票选出最佳答案。
  • Prompt Bagging:使用多个设计不同的 Prompt 输入,结合结果进行优化。
  • Ensemble Refinement:利用多个模型分别生成答案,最后组合成最终输出。
6.Reflection/System2 像人类一样非线性思考问题、reasoning、planning
  • ReAct、ToT

有训练成本

1. SFT(Supervised Fine-Tuning)通过监督微调对模型进行对齐(Alignment)
  • Full FT(全模型微调):调整整个模型参数,适合大规模定制。
  • PEFT(Parameter-Efficient Fine-Tuning):只调整部分参数(如 LoRA),资源友好。

具体方案

  1. 准备标注数据集。
  2. 选择微调方法:
    • 全模型微调(Full Fine-tuning)。
    • 参数高效微调(PEFT),如 LoRA。
  3. 使用分布式训练框架(如 Hugging Face Trainer)进行训练。
2. 增量预训练(Incremental Pretraining)增量预训练(Incremental Pretraining)
  • 在特定领域数据上继续预训练模型,增强领域能力。 MOE
3. MOE(Mixture of Experts)MOE(Mixture of Experts)
  • 通过动态激活模型的部分模块,提升大模型的训练效率和推理能力。好的数据配比、数据质量、训练技巧、训练资源。

总结建议

  1. 如果需要快速实现功能、资源有限,优先选择无训练成本方案,如:
    • 使用 Prompt Engineering(ICL + CoT)改进回答质量。
    • 结合检索增强模型(RAG)。
    • 借助 Function Call 和 Plugin 扩展功能。
  2. 如果追求高精度、领域定制化或长期优化,选择有训练成本方案,如:
    • 使用 SFT 对齐模型输出格式。
    • 在特定领域内增量预训练或全面预训练新模型。

选择具体实现方案需根据应用场景、技术资源和业务需求综合评估。

相关文章:

基于大模型LLM 应用方案

现如今LLM 应用 面临的主要问题 准确性,2. 高成本,3. 专业性,4. 时效性,5. 安全性 信息偏差/幻觉 (大模型由于数据缺陷/知识边界 会使用 可靠性下降)知识更新滞后性 (LLM 基于静态数据集训练,可能导致知识更…...

实用技巧:关于 AD修改原理图库如何同步更新到有原理图 的解决方法

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/144738332 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…...

区块链平台安全属性解释

区块链平台安全属性解释 双向认证 解释:双向认证是指在通信过程中,**通信双方都需要对对方的身份进行验证,确保对方是合法的、可信任的实体。**只有双方身份都得到确认后,通信才会被允许进行,从而防止非法用户的接入和数据的窃取或篡改。举例:在基于区块链和联邦学习的数…...

1228作业

思维导图 作业 TCP的cs模型 服务器 //服务器 #include <myhead.h> #define PORT 6667 #define IP "192.168.124.94" #define BACKLOG 128 int main(int argc, const char *argv[]) {//创建套接字int oldfd socket(AF_INET,SOCK_STREAM,0);if(oldfd-1){perro…...

Machine-learning the skill of mutual fund managers

Machine-learning the skill of mutual fund managers – 论文阅读 文章目录 Machine-learning the skill of mutual fund managers -- 论文阅读AbstractIntroductionQuestionMain findingscontributionsliterature reviewDataSampleHoldings-based characteristicsModelOptima…...

Windows下Python+PyCharm的安装步骤及PyCharm的使用

Windows下PythonPyCharm的安装步骤及PyCharm的使用 文章目录 Windows下PythonPyCharm的安装步骤及PyCharm的使用一、Python的安装&#xff08;1&#xff09;环境准备&#xff08;2&#xff09;Python安装&#xff08;3&#xff09;pip组件的安装 二、PyCharm的安装&#xff08;…...

Anaconda+PyTorch(CPU版)安装

1.Anaconda下载 Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 如果已安装python&#xff0c;下载之前要彻底删除之前下载的python 2.Anaconda安装 3.添加环境变量 //根据实际安装路径进行更改 D:\Anaconda D:\Anaconda\Scripts D:\…...

第 28 章 - ES 源码篇 - Elasticsearch 启动与插件加载机制解析

前言 不管是什么框架&#xff0c;启动类里面做的一定是初始化的工作&#xff01; 启动 ES 节点的启动逻辑&#xff0c;全部都在 org.elasticsearch.bootstrap 包下。 启动类为&#xff1a;Elasticsearch#main(final String[] args) 与大多数框架启动类一致。启动类主要负责的…...

机床数据采集网关在某机械制造企业的应用

随着工业4.0时代的到来&#xff0c;智能制造已成为制造业转型升级的重要方向。数控机床作为现代制造业的核心设备&#xff0c;其运行状态和加工参数的数据实时采集与分析对于提升生产效率、优化生产流程具有关键意义。 背景概述 某机械制造企业拥有多台数控机床&#xff0c;这…...

美团Android开发200道面试题及参考答案(上)

http 三次握手 / 四次挥手具体过程,信号量的变化,只有两次握手行不行 三次握手过程: 第一次握手:客户端向服务器发送一个 SYN(同步)标志位为 1 的 TCP 报文段,其中包含客户端的初始序列号(ISN),此时客户端进入 SYN_SENT 状态,表示客户端请求建立连接。第二次握手:服…...

MQTT协议的应用场景及特点和常见的概念03

发布者发送数据---》代理软件Broker---》订阅者接收数据 发布者和订阅者进行隔离 1.空间上的隔离 2.时间上的隔离 MQTT常见的应用场景&#xff1a;物联网行业 MQTT常见的特点: 1.轻量级&#xff1a;MQTT协议占用的系统资源较少&#xff0c;数据报文较小 2.可靠性较强&#xff1…...

电脑缺失sxs.dll文件要怎么解决?

一、文件丢失问题&#xff1a;以sxs.dll文件缺失为例 当你在运行某个程序时&#xff0c;如果系统提示“找不到sxs.dll文件”&#xff0c;这意味着你的系统中缺少了一个名为sxs.dll的动态链接库文件。sxs.dll文件通常与Microsoft的.NET Framework相关&#xff0c;是许多应用程序…...

数据处的存储与处理——添加数组

Numpy模块中的append()函数和insert()函数 1、append()函数的使用 append(arr,values,axisNone) arr 必选&#xff0c;要添加元素的数组 values 必选&#xff0c;要添加的元素数组 axis 可选&#xff0c;默认值为None。当省略该参数时&#xff0c;表示在…...

24-12-28-pytorch深度学习CUDA的GPU加速环境配置步骤

文章目录 pytorch深度学习CUDA的GPU加速环境配置步骤1. 更新cuda驱动2. 更新完成cuda驱动后&#xff0c;查看对应的驱动版本3. 根据驱动的版本号&#xff0c;下载对应的cuda-toolkit4. CUDA是否配置成功5. 配置CUDNN6. 配置torch pytorch深度学习CUDA的GPU加速环境配置步骤 1.…...

YOLO系列正传(五)YOLOv4论文精解(上):从CSPNet、SPP、PANet到CSPDarknet-53

系列文章 YOLO系列基础 YOLO系列基础合集——小白也看得懂的论文精解-CSDN博客 YOLO系列正传 YOLO系列正传&#xff08;一&#xff09;类别损失与MSE损失函数、交叉熵损失函数-CSDN博客 YOLO系列正传&#xff08;二&#xff09;YOLOv3论文精解(上)——从FPN到darknet-53-C…...

【AIGC-ChatGPT副业提示词指令 - 动图】魔法咖啡馆:一个融合创意与治愈的互动体验设计

引言 在当今快节奏的生活中&#xff0c;咖啡早已不仅仅是提神醒脑的饮品&#xff0c;更成为了一种情感寄托和生活态度的表达。本文将介绍一个独特的"魔法咖啡馆"互动体验设计&#xff0c;通过将咖啡与情感、魔法元素相结合&#xff0c;创造出一个充满想象力和治愈感…...

AIGC在电影与影视制作中的应用:提高创作效率与创意的无限可能

云边有个稻草人-CSDN博客 目录 引言 一、AIGC在剧本创作中的应用 1.1 剧本创作的传统模式与挑战 1.2 AIGC如何协助剧本创作 1.3 未来的剧本创作&#xff1a;AI辅助的协同创作 二、AIGC在角色设计中的应用 2.1 传统角色设计的挑战 2.2 AIGC如何协助角色设计 三、AIGC在…...

第三百四十六节 JavaFX教程 - JavaFX绑定

JavaFX教程 - JavaFX绑定 JavaFX绑定同步两个值&#xff1a;当因变量更改时&#xff0c;其他变量更改。 要将属性绑定到另一个属性&#xff0c;请调用bind()方法&#xff0c;该方法在一个方向绑定值。例如&#xff0c;当属性A绑定到属性B时&#xff0c;属性B的更改将更新属性A…...

IDEA+Docker一键部署项目SpringBoot项目

文章目录 1. 部署项目的传统方式2. 前置工作3. SSH配置4. 连接Docker守护进程5. 创建简单的SpringBoot应用程序6. 编写Dockerfile文件7. 配置远程部署 7.1 创建配置7.2 绑定端口7.3 添加执行前要运行的任务 8. 部署项目9. 开放防火墙的 11020 端口10. 访问项目11. 可能遇到的问…...

vue Promise使用

new Promise((resolve, reject) > { ... }) 是 JavaScript 中创建 Promise 实例的语法。Promise 是一种用于处理异步操作的对象&#xff0c;它代表了一个异步操作的最终完成&#xff08;或失败&#xff09;及其结果值。 Promise 的基本结构 javascript 深色版本 const my…...

盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来

一、破局&#xff1a;PCB行业的时代之问 在数字经济蓬勃发展的浪潮中&#xff0c;PCB&#xff08;印制电路板&#xff09;作为 “电子产品之母”&#xff0c;其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透&#xff0c;PCB行业面临着前所未有的挑战与机遇。产品迭代…...

《Playwright:微软的自动化测试工具详解》

Playwright 简介:声明内容来自网络&#xff0c;将内容拼接整理出来的文档 Playwright 是微软开发的自动化测试工具&#xff0c;支持 Chrome、Firefox、Safari 等主流浏览器&#xff0c;提供多语言 API&#xff08;Python、JavaScript、Java、.NET&#xff09;。它的特点包括&a…...

为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?

在建筑行业&#xff0c;项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升&#xff0c;传统的管理模式已经难以满足现代工程的需求。过去&#xff0c;许多企业依赖手工记录、口头沟通和分散的信息管理&#xff0c;导致效率低下、成本失控、风险频发。例如&#…...

页面渲染流程与性能优化

页面渲染流程与性能优化详解&#xff08;完整版&#xff09; 一、现代浏览器渲染流程&#xff08;详细说明&#xff09; 1. 构建DOM树 浏览器接收到HTML文档后&#xff0c;会逐步解析并构建DOM&#xff08;Document Object Model&#xff09;树。具体过程如下&#xff1a; (…...

【算法训练营Day07】字符串part1

文章目录 反转字符串反转字符串II替换数字 反转字符串 题目链接&#xff1a;344. 反转字符串 双指针法&#xff0c;两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

Psychopy音频的使用

Psychopy音频的使用 本文主要解决以下问题&#xff1a; 指定音频引擎与设备&#xff1b;播放音频文件 本文所使用的环境&#xff1a; Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...

根据万维钢·精英日课6的内容,使用AI(2025)可以参考以下方法:

根据万维钢精英日课6的内容&#xff0c;使用AI&#xff08;2025&#xff09;可以参考以下方法&#xff1a; 四个洞见 模型已经比人聪明&#xff1a;以ChatGPT o3为代表的AI非常强大&#xff0c;能运用高级理论解释道理、引用最新学术论文&#xff0c;生成对顶尖科学家都有用的…...

优选算法第十二讲:队列 + 宽搜 优先级队列

优选算法第十二讲&#xff1a;队列 宽搜 && 优先级队列 1.N叉树的层序遍历2.二叉树的锯齿型层序遍历3.二叉树最大宽度4.在每个树行中找最大值5.优先级队列 -- 最后一块石头的重量6.数据流中的第K大元素7.前K个高频单词8.数据流的中位数 1.N叉树的层序遍历 2.二叉树的锯…...

现有的 Redis 分布式锁库(如 Redisson)提供了哪些便利?

现有的 Redis 分布式锁库&#xff08;如 Redisson&#xff09;相比于开发者自己基于 Redis 命令&#xff08;如 SETNX, EXPIRE, DEL&#xff09;手动实现分布式锁&#xff0c;提供了巨大的便利性和健壮性。主要体现在以下几个方面&#xff1a; 原子性保证 (Atomicity)&#xff…...

MySQL 部分重点知识篇

一、数据库对象 1. 主键 定义 &#xff1a;主键是用于唯一标识表中每一行记录的字段或字段组合。它具有唯一性和非空性特点。 作用 &#xff1a;确保数据的完整性&#xff0c;便于数据的查询和管理。 示例 &#xff1a;在学生信息表中&#xff0c;学号可以作为主键&#xff…...