当前位置: 首页 > news >正文

基于大模型LLM 应用方案

现如今LLM 应用 面临的主要问题

  1. 准确性,2. 高成本,3. 专业性,4. 时效性,5. 安全性
  • 信息偏差/幻觉 (大模型由于数据缺陷/知识边界 会使用 可靠性下降)
  • 知识更新滞后性 (LLM 基于静态数据集训练,可能导致知识更新滞后,无法及时反映最新信息动态。)
  • 内容不可追溯: (LLM 生成的内容往往缺乏明确的信息来源,影响内容的可信度。)
  • 推理能力限制:(LLM 可能缺乏必要的推理能力)
  • 长文本处理能力较弱:(受限于有限的上下文窗口,处理速度随着输入长度增加而减慢)

主流方案

无训练成本

直接使用已经训练好的预训练模型,不需要额外训练,

1. 只通过输入或微调提示(Prompt Engineering)实现功能。

System Prompt + ICL(In-Context Learning)在 Prompt 中提供示例,模型基于示例进行推理+ CoT(Chain of Thought)通过推理链 分步引导,模型逐步推理以提高复杂问题的解决能力:
提供明确的上下文和示例,指导模型分步骤推理,增强回答质量。

2. 限定回答范围(Guidance):通过明确的指令限制模型输出格式和范围。
3. Retrieval Augmented Generation (RAG)通过检索外部知识,补充模型的生成能力。

langchain

  • 基于检索返回的内容做Prompt增强
    当前完整的 RAG 应用流程主要包含两个阶段:
    • 数据准备阶段:数据提取——>文本分割——>向量化(embedding)——>数据入库

    • 应用阶段:用户提问——>数据检索(召回)——>注入 Prompt——>LLM 生成答案

  • Bing-like 模式
    结合全网搜索结果,增强模型的知识范围 调用通用搜索引擎(如 Bing、Google)。调用通用搜索引擎(如 Bing、Google)。

Perplexity.ai

Google Search Labs

4. Function Call + Plugins 通过外部工具(如函数调用、插件)扩展模型能力。

Function calling

5. Ensemble/Bagging 通过多次调用模型,使用不同提示或结果整合,提升回答的质量和一致性。

Med-PaLM 2

  • CoT-SC(Self-Consistency):对一个问题生成多个答案,投票选出最佳答案。
  • Prompt Bagging:使用多个设计不同的 Prompt 输入,结合结果进行优化。
  • Ensemble Refinement:利用多个模型分别生成答案,最后组合成最终输出。
6.Reflection/System2 像人类一样非线性思考问题、reasoning、planning
  • ReAct、ToT

有训练成本

1. SFT(Supervised Fine-Tuning)通过监督微调对模型进行对齐(Alignment)
  • Full FT(全模型微调):调整整个模型参数,适合大规模定制。
  • PEFT(Parameter-Efficient Fine-Tuning):只调整部分参数(如 LoRA),资源友好。

具体方案

  1. 准备标注数据集。
  2. 选择微调方法:
    • 全模型微调(Full Fine-tuning)。
    • 参数高效微调(PEFT),如 LoRA。
  3. 使用分布式训练框架(如 Hugging Face Trainer)进行训练。
2. 增量预训练(Incremental Pretraining)增量预训练(Incremental Pretraining)
  • 在特定领域数据上继续预训练模型,增强领域能力。 MOE
3. MOE(Mixture of Experts)MOE(Mixture of Experts)
  • 通过动态激活模型的部分模块,提升大模型的训练效率和推理能力。好的数据配比、数据质量、训练技巧、训练资源。

总结建议

  1. 如果需要快速实现功能、资源有限,优先选择无训练成本方案,如:
    • 使用 Prompt Engineering(ICL + CoT)改进回答质量。
    • 结合检索增强模型(RAG)。
    • 借助 Function Call 和 Plugin 扩展功能。
  2. 如果追求高精度、领域定制化或长期优化,选择有训练成本方案,如:
    • 使用 SFT 对齐模型输出格式。
    • 在特定领域内增量预训练或全面预训练新模型。

选择具体实现方案需根据应用场景、技术资源和业务需求综合评估。

相关文章:

基于大模型LLM 应用方案

现如今LLM 应用 面临的主要问题 准确性,2. 高成本,3. 专业性,4. 时效性,5. 安全性 信息偏差/幻觉 (大模型由于数据缺陷/知识边界 会使用 可靠性下降)知识更新滞后性 (LLM 基于静态数据集训练,可能导致知识更…...

实用技巧:关于 AD修改原理图库如何同步更新到有原理图 的解决方法

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/144738332 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…...

区块链平台安全属性解释

区块链平台安全属性解释 双向认证 解释:双向认证是指在通信过程中,**通信双方都需要对对方的身份进行验证,确保对方是合法的、可信任的实体。**只有双方身份都得到确认后,通信才会被允许进行,从而防止非法用户的接入和数据的窃取或篡改。举例:在基于区块链和联邦学习的数…...

1228作业

思维导图 作业 TCP的cs模型 服务器 //服务器 #include <myhead.h> #define PORT 6667 #define IP "192.168.124.94" #define BACKLOG 128 int main(int argc, const char *argv[]) {//创建套接字int oldfd socket(AF_INET,SOCK_STREAM,0);if(oldfd-1){perro…...

Machine-learning the skill of mutual fund managers

Machine-learning the skill of mutual fund managers – 论文阅读 文章目录 Machine-learning the skill of mutual fund managers -- 论文阅读AbstractIntroductionQuestionMain findingscontributionsliterature reviewDataSampleHoldings-based characteristicsModelOptima…...

Windows下Python+PyCharm的安装步骤及PyCharm的使用

Windows下PythonPyCharm的安装步骤及PyCharm的使用 文章目录 Windows下PythonPyCharm的安装步骤及PyCharm的使用一、Python的安装&#xff08;1&#xff09;环境准备&#xff08;2&#xff09;Python安装&#xff08;3&#xff09;pip组件的安装 二、PyCharm的安装&#xff08;…...

Anaconda+PyTorch(CPU版)安装

1.Anaconda下载 Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 如果已安装python&#xff0c;下载之前要彻底删除之前下载的python 2.Anaconda安装 3.添加环境变量 //根据实际安装路径进行更改 D:\Anaconda D:\Anaconda\Scripts D:\…...

第 28 章 - ES 源码篇 - Elasticsearch 启动与插件加载机制解析

前言 不管是什么框架&#xff0c;启动类里面做的一定是初始化的工作&#xff01; 启动 ES 节点的启动逻辑&#xff0c;全部都在 org.elasticsearch.bootstrap 包下。 启动类为&#xff1a;Elasticsearch#main(final String[] args) 与大多数框架启动类一致。启动类主要负责的…...

机床数据采集网关在某机械制造企业的应用

随着工业4.0时代的到来&#xff0c;智能制造已成为制造业转型升级的重要方向。数控机床作为现代制造业的核心设备&#xff0c;其运行状态和加工参数的数据实时采集与分析对于提升生产效率、优化生产流程具有关键意义。 背景概述 某机械制造企业拥有多台数控机床&#xff0c;这…...

美团Android开发200道面试题及参考答案(上)

http 三次握手 / 四次挥手具体过程,信号量的变化,只有两次握手行不行 三次握手过程: 第一次握手:客户端向服务器发送一个 SYN(同步)标志位为 1 的 TCP 报文段,其中包含客户端的初始序列号(ISN),此时客户端进入 SYN_SENT 状态,表示客户端请求建立连接。第二次握手:服…...

MQTT协议的应用场景及特点和常见的概念03

发布者发送数据---》代理软件Broker---》订阅者接收数据 发布者和订阅者进行隔离 1.空间上的隔离 2.时间上的隔离 MQTT常见的应用场景&#xff1a;物联网行业 MQTT常见的特点: 1.轻量级&#xff1a;MQTT协议占用的系统资源较少&#xff0c;数据报文较小 2.可靠性较强&#xff1…...

电脑缺失sxs.dll文件要怎么解决?

一、文件丢失问题&#xff1a;以sxs.dll文件缺失为例 当你在运行某个程序时&#xff0c;如果系统提示“找不到sxs.dll文件”&#xff0c;这意味着你的系统中缺少了一个名为sxs.dll的动态链接库文件。sxs.dll文件通常与Microsoft的.NET Framework相关&#xff0c;是许多应用程序…...

数据处的存储与处理——添加数组

Numpy模块中的append()函数和insert()函数 1、append()函数的使用 append(arr,values,axisNone) arr 必选&#xff0c;要添加元素的数组 values 必选&#xff0c;要添加的元素数组 axis 可选&#xff0c;默认值为None。当省略该参数时&#xff0c;表示在…...

24-12-28-pytorch深度学习CUDA的GPU加速环境配置步骤

文章目录 pytorch深度学习CUDA的GPU加速环境配置步骤1. 更新cuda驱动2. 更新完成cuda驱动后&#xff0c;查看对应的驱动版本3. 根据驱动的版本号&#xff0c;下载对应的cuda-toolkit4. CUDA是否配置成功5. 配置CUDNN6. 配置torch pytorch深度学习CUDA的GPU加速环境配置步骤 1.…...

YOLO系列正传(五)YOLOv4论文精解(上):从CSPNet、SPP、PANet到CSPDarknet-53

系列文章 YOLO系列基础 YOLO系列基础合集——小白也看得懂的论文精解-CSDN博客 YOLO系列正传 YOLO系列正传&#xff08;一&#xff09;类别损失与MSE损失函数、交叉熵损失函数-CSDN博客 YOLO系列正传&#xff08;二&#xff09;YOLOv3论文精解(上)——从FPN到darknet-53-C…...

【AIGC-ChatGPT副业提示词指令 - 动图】魔法咖啡馆:一个融合创意与治愈的互动体验设计

引言 在当今快节奏的生活中&#xff0c;咖啡早已不仅仅是提神醒脑的饮品&#xff0c;更成为了一种情感寄托和生活态度的表达。本文将介绍一个独特的"魔法咖啡馆"互动体验设计&#xff0c;通过将咖啡与情感、魔法元素相结合&#xff0c;创造出一个充满想象力和治愈感…...

AIGC在电影与影视制作中的应用:提高创作效率与创意的无限可能

云边有个稻草人-CSDN博客 目录 引言 一、AIGC在剧本创作中的应用 1.1 剧本创作的传统模式与挑战 1.2 AIGC如何协助剧本创作 1.3 未来的剧本创作&#xff1a;AI辅助的协同创作 二、AIGC在角色设计中的应用 2.1 传统角色设计的挑战 2.2 AIGC如何协助角色设计 三、AIGC在…...

第三百四十六节 JavaFX教程 - JavaFX绑定

JavaFX教程 - JavaFX绑定 JavaFX绑定同步两个值&#xff1a;当因变量更改时&#xff0c;其他变量更改。 要将属性绑定到另一个属性&#xff0c;请调用bind()方法&#xff0c;该方法在一个方向绑定值。例如&#xff0c;当属性A绑定到属性B时&#xff0c;属性B的更改将更新属性A…...

IDEA+Docker一键部署项目SpringBoot项目

文章目录 1. 部署项目的传统方式2. 前置工作3. SSH配置4. 连接Docker守护进程5. 创建简单的SpringBoot应用程序6. 编写Dockerfile文件7. 配置远程部署 7.1 创建配置7.2 绑定端口7.3 添加执行前要运行的任务 8. 部署项目9. 开放防火墙的 11020 端口10. 访问项目11. 可能遇到的问…...

vue Promise使用

new Promise((resolve, reject) > { ... }) 是 JavaScript 中创建 Promise 实例的语法。Promise 是一种用于处理异步操作的对象&#xff0c;它代表了一个异步操作的最终完成&#xff08;或失败&#xff09;及其结果值。 Promise 的基本结构 javascript 深色版本 const my…...

从查表到公式:PT100温度转换的两种实现(附STM32+MAX31865完整代码)

从查表到公式&#xff1a;PT100温度转换的两种实现&#xff08;附STM32MAX31865完整代码&#xff09; 在工业测量和精密温度控制领域&#xff0c;PT100铂电阻因其出色的稳定性和线性度成为温度传感的首选。当工程师通过MAX31865芯片获取到PT100的电阻值后&#xff0c;如何高效准…...

告别复杂配置!OSHI+JNA五分钟搞定Windows/Linux/macOS硬件信息采集

五分钟极简指南&#xff1a;用OSHIJNA实现全平台硬件监控零门槛接入 运维工程师小张最近接手了公司混合云环境下的服务器监控任务。当他面对Windows服务器、Linux虚拟机、macOS开发机三种不同系统时&#xff0c;传统方案需要分别调用WMI、/proc文件系统和system_profiler&#…...

VideoAgentTrek-ScreenFilter视觉盛宴:处理4K超高清屏幕录像的效果与性能挑战

VideoAgentTrek-ScreenFilter视觉盛宴&#xff1a;处理4K超高清屏幕录像的效果与性能挑战 最近在折腾一些屏幕录像的后期处理&#xff0c;特别是那些4K分辨率、高帧率的超高清素材。说实话&#xff0c;直接处理这种级别的视频&#xff0c;对硬件和软件都是不小的考验。我试用了…...

DSQC346G 3HAB8101-8 机器人伺服驱动单元

DSQC346G 3HAB8101‑8 机器人伺服驱动单元介绍DSQC346G&#xff08;3HAB8101‑8&#xff09;是一款专用于工业机器人伺服系统的驱动单元&#xff0c;用于控制伺服电机的运动与输出&#xff0c;实现机器人关节或轴的精确位置、速度和力矩控制&#xff0c;是机器人驱动链中的核心…...

OpenCore Legacy Patcher技术指南:让老旧Mac焕发新生的系统扩展方案

OpenCore Legacy Patcher技术指南&#xff1a;让老旧Mac焕发新生的系统扩展方案 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 当您的Mac设备因苹果官方停止…...

foobox-cn:让foobar2000焕发新生的界面美化方案

foobox-cn&#xff1a;让foobar2000焕发新生的界面美化方案 【免费下载链接】foobox-cn DUI 配置 for foobar2000 项目地址: https://gitcode.com/GitHub_Trending/fo/foobox-cn 你是否厌倦了foobar2000单调的默认界面&#xff1f;是否希望在享受高品质音乐的同时&#…...

CVAT数据标注工具保姆级安装教程:从Docker部署到第一个标注任务

CVAT数据标注工具保姆级安装教程&#xff1a;从Docker部署到第一个标注任务 计算机视觉项目的成功往往始于高质量的数据标注。CVAT&#xff08;Computer Vision Annotation Tool&#xff09;作为英特尔开源的标注工具&#xff0c;凭借其丰富的标注类型支持和灵活的部署方式&am…...

别再为UI动画发愁了!用Spine+Unity 2021制作丝滑2D动画的保姆级流程

SpineUnity 2021&#xff1a;打造专业级2D UI动画的完整实战指南 在独立游戏开发领域&#xff0c;UI动画的质量往往决定着玩家的第一印象。那些流畅的按钮反馈、生动的界面过渡&#xff0c;不仅提升了产品质感&#xff0c;更直接影响着用户的留存率。然而对于资源有限的中小团队…...

迈瑞医疗营收超330亿,国际业务持续发力未来何在?

最近的财报季&#xff0c;各家上市公司的财报都牵动着每个人的心&#xff0c;就在最近迈瑞医疗的成绩单公布&#xff0c;营收超330亿&#xff0c;国际业务持续向好&#xff0c;这样的成绩单我们到底该怎么看待呢&#xff1f;一、迈瑞医疗业绩稳健向好据每日经济新闻的报道&…...

如何用开源工具实现3D打印钥匙自由?从参数测量到模型生成的实践路径

如何用开源工具实现3D打印钥匙自由&#xff1f;从参数测量到模型生成的实践路径 【免费下载链接】keygen OpenSCAD tools for generating physical keys 项目地址: https://gitcode.com/gh_mirrors/ke/keygen 在数字化制造蓬勃发展的今天&#xff0c;3D打印技术正逐步走…...