当前位置: 首页 > article >正文

【大模型基础_毛玉仁】3.5 Prompt相关应用


目录

    • 3.5 相关应用
      • 3.5.1 基于大语言模型的Agent
      • 3.5.2 数据合成
      • 3.5.3 Text-to-SQL
      • 3.5.4 GPTs


3.5 相关应用

Prompt工程应用广泛,能提升大语言模型处理基础及复杂任务的能力,在构建Agent、数据合成、Text-to-SQL转换和设计个性化GPTs等方面不可或缺。

.

3.5.1 基于大语言模型的Agent

智能体(Agent)是能自主感知并行动以达成目标的实体,作为实现通用人工智能(AGI)的有力手段,被期望在多样化环境中完成复杂任务并展现类人智能。

传统Agent依赖简单启发式策略函数,在受限环境中学习操作,难以复制人类决策过程,限制了其能力与应用范围。基于大语言模型的Agent展现出强大决策能力,拥有全面通用知识,即便缺乏训练数据,也能进行规划、决策、工具调用等复杂行动。

Prompt工程在Agent中至关重要。Agent系统以大语言模型为核心控制器,依赖Prompt完成规划、决策、行动等操作。其框架包括:配置模块(Profile)、记忆模块(Memory)、计划模块(Planning)和行动模块(Action),Prompt工程技术贯穿整个流程,为各模块提供支持。

图3.30: 基于大语言模型的Agent框架流程示意图
在这里插入图片描述

在Agent中:

  • 配置模块:利用Prompt工程的角色扮演技术定义Agent角色,将其背景、技能等信息嵌入交互Prompt;

  • 记忆模块:作为存储中心,通过检索增强等技术并借助上下文学习优化查询,将获取的记忆添加到交互Prompt中辅助决策;

  • 计划模块:借助Prompt工程的思维链和上下文学习技术,将复杂任务分解为子任务并调控粒度;

  • 行动模块:将计划转化为行动步骤,通过工具API接口生成并执行代码以实现目标。这四个组件分工协作完成复杂任务。

.

3.5.2 数据合成

数据质量是决定大语言模型性能的关键因素之一,因为“Garbage in, Garbage out”,即模型表现高度依赖训练数据的质量,无论模型架构、训练算法和计算资源多么优秀。然而,获取高质量数据面临挑战:

  • 公共领域:高质量语言数据预计2026年左右耗尽;

  • 特定领域:垂直数据因隐私保护和标注难度等问题难以大量提供,限制了模型的进一步发展。

数据合成作为补充或替代真实数据的手段,因可控、安全、低成本等优势受关注,特别是利用大语言模型生成训练数据成为研究热点。

通过Prompt工程技术,利用大语言模型的思维和指令跟随能力合成高质量数据,Self-Instruct是代表性方法。它通过构建Prompt,多步骤调用大语言模型,依据少量指令数据合成大量多样化指令数据。

如金融场景中,先人工标注少量金融指令数据,再用Self-Instruct方法调用大语言模型,将数据扩展至数万条且保持高质量和多样性。

图3.31: Self-Instruct 流程示例图
在这里插入图片描述

Self-Instruct 包含构建任务池、指令生成、指令分类、数据生成、数据过滤五个步骤。

  • 任务池:存储初始及后续生成的指令数据;

  • 指令生成:参考任务池样例生成指令部分;

  • 指令分类:将指令分为分类任务和生成任务,不同模式下生成数据方式不同;

  • 数据生成:根据已有指令生成输入和回答部分;

  • 数据过滤:去除低质量数据,保证指令数据质量。

它从有限的手动编写任务种子集开始,通过与大语言模型交互,不断生成指令数据,扩充原始数据集。

.

3.5.3 Text-to-SQL

Text-to-SQL:将自然语言查询翻译成可执行SQL语句。

C3是最早使用大语言模型进行零样本Text-to-SQL的方法,其核心是Prompt工程设计,包括三个关键部分:清晰提示(ClearPrompting)、提示校准(Calibration with Hints)和一致输出(Consistent Output)。

图3.33: C3 方法整体框架图
在这里插入图片描述

在模型输入端,清晰提示包含:

  • 清晰布局:通过明确符号划分指令、上下文和问题,提升模型理解能力;

  • 清晰上下文:设计零样本Prompt,指示模型从数据库中召回相关信息,提高SQL生成准确性。

为应对模型固有偏差,C3采用提示校准策略,利用包含历史对话的上下文提示,将先验知识纳入模型,通过设定模型为SQL专家角色并引导其遵循预设提示,有效校准偏差。

在模型输出端,C3采用输出校准,应用Self-Consistency方法对多种推理路径采样,选择最一致的答案,增强输出稳定性,保持SQL查询一致性。

.

3.5.4 GPTs

GPTs是OpenAI推出的支持用户自定义的GPT应用,允许用户通过编写Prompt, 添加工具等方式创建定制版的GPT应用,也可以使用别人分享的GPTs模型。

.


其他参考:【大模型基础_毛玉仁】系列文章


声明:资源可能存在第三方来源,若有侵权请联系删除!

相关文章:

【大模型基础_毛玉仁】3.5 Prompt相关应用

目录 3.5 相关应用3.5.1 基于大语言模型的Agent3.5.2 数据合成3.5.3 Text-to-SQL3.5.4 GPTs 3.5 相关应用 Prompt工程应用广泛,能提升大语言模型处理基础及复杂任务的能力,在构建Agent、数据合成、Text-to-SQL转换和设计个性化GPTs等方面不可或缺。 . …...

《Python全栈开发》第12课:RESTful API设计 - 构建现代化接口

🌟 课程目标 理解REST设计原则掌握Flask-RESTful开发实现JWT认证接口构建标准化API文档一、REST是什么?(餐厅点餐系统比喻) 1.1 REST核心原则 #mermaid-svg-0rLbveAhUdJCLKTy {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;…...

深入解析libsunrpc:构建分布式系统的核心RPC库

深入解析libsunrpc:构建分布式系统的核心RPC库 引言 在分布式系统开发中,远程过程调用(Remote Procedure Call, RPC) 是连接不同节点、实现跨网络服务调用的关键技术。作为SUN公司开源的经典RPC实现,libsunrpc 凭借其…...

deepseek搭建本地私有知识库dify安装介绍docker compose图文教程

按照官方介绍,打开教程安装。下载源码, # 假设当前最新版本为 0.15.3 git clone https://github.com/langgenius/dify.git --branch 0.15.3 进入docker目录, cd dify/docker 网络科学的直接执行命令就可以了。 docker compose up -d 镜…...

C语言动态内存管理深度解析与嵌入式开发实战

C语言动态内存管理深度解析与嵌入式开发实战 (高级嵌入式软件开发工程师视角) ​一、动态内存函数原理与差异 ​malloc ​核心机制:从堆区分配指定字节的未初始化内存,返回void*指针。失败时返回NULL,必须检查返回值…...

右击没有Word、PPT、Excel功能

右击没有Word、PPT、Excel功能 导航 文章目录 右击没有Word、PPT、Excel功能导航一、问题描述二、事情经过三、解决方案其他思路分享 一、问题描述 ​ 在安装并激活了office之后,业务反馈右击没有出现新建Word功能,仅有Word文档 二、事情经过 ​ 按道…...

無人機高空收集地形之linux server 的應用部署

如何在Linux服务器上部署无人机高空地形测量应用? 一、技术实现步骤 系统环境搭建 操作系统与ROS安装 在Linux服务器(推荐Ubuntu LTS版本)上安装ROS(机器人操作系统),例如ROS Noetic或ROS2 Humble1。ROS提…...

DeepSeek R1 本地部署指南 (6) - Windows 本地部署使用 GPU 运行

DeepSeek R1 本地部署指南 (1) - Windows 本地部署 上一篇,安装好 Windows 本地步骤后,如果发现在任务管理器中 GPU 显示 0%。 1.在命令行中输入: ollama ps 显示: PROCESSOR CPU 2.安装 CUDA Toolkit CUDA Toolkit Downloads htt…...

鸿蒙进行视频上传,使用 request.uploadFile方法

一.拉起选择器进行视频选择,并且创建文件名称 async getPictureFromAlbum() {// 拉起相册,选择图片let PhotoSelectOptions new photoAccessHelper.PhotoSelectOptions();PhotoSelectOptions.MIMEType photoAccessHelper.PhotoViewMIMETypes.VIDEO_TY…...

婚姻的解构与重构 | 一场关于选择与责任的探索

注:本文为 “婚姻的解构与重构” 相关文章合辑。 未整理。 明明渴望爱情 为何反感催婚? 原创 常 晋 人民日报评论 2024 年 04 月 22 日 12:29 北京 没有催促指责,也毫无批评之意。面对单身、失业的 30 岁女儿,只是鼓励孩子&…...

jangow靶机攻略

配置网卡 VMware需要配置,不配置扫不到ip,VirtualBox正常打开ip会直接显示出来 网卡配置都改成NAT 打开虚拟机,第一个框选第二行,回车 选第二个,按e键 进入下一个框后,将ro 后面的修改为 rw signin init/bin/bash 按…...

自动化测试框架维护成本高怎么办

自动化测试框架维护成本高,可以通过优化测试用例设计、引入持续集成(CI)策略、强化代码规范和审查机制、建立明确的维护计划、定期进行技术债务清理等方式来降低成本。 其中,优化测试用例设计尤其关键,它不仅能提高测试…...

日事清在敏捷开发中的实战应用:SCRUM框架下可视化项目管理+高效沟通机制驱动灵活迭代

一、行业背景 在快速发展的互联网行业中,软件开发模式经历了显著的演变。传统的瀑布式开发模式,以其线性和阶段性的特点,曾长期占据主导地位。然而,随着市场对软件迭代速度和灵活性的要求日益提高,敏捷开发模式应运而…...

Buildroot 增加系统启动项并解决后台无法获取输入(串口)

Buildroot 增加自启动项 概述增加模块源码结构编写测试程序编译测试增加系统自启动一个问题解决方案:显式指定输入设备 其他/etc/init.d 目录下的 SXXxxx 文件作用解析‌ 概述 Buildroot 是一款轻量级、高度可定制的开源工具集,专为嵌入式系统打造。它通…...

【Javaweb】b站黑马视频学习笔记

Javaweb学习导览 1.Mysql...

使用ThreadLocal可能导致内存泄漏的原因与其底层实现机制

学海无涯,志当存远。燃心砺志,奋进不辍。 愿诸君得此鸡汤,如沐春风,事业有成。 若觉此言甚善,烦请赐赞一枚,共励学途,同铸辉煌! 首先,ThreadLocalThreadLocal的基本原理。…...

OpenHarmony和HarmonyOS到底有什么区别?

HarmonyOS 与 OpenHarmony差异化剖析 背景介绍 HarmonyOS 是华为的闭源商业操作系统,旨在为智能手机、平板和 IoT 设备提供统一的用户体验。而 OpenHarmony 是其开源版本,适合开发者定制各种设备系统。两者共享部分代码,但 API 差异反映了各…...

HTML5 MathML 学习笔记

一、什么是MathML MathML(Mathematical Markup Language)是一种数学标记语言,用于在互联网上书写数学符号和公式。MathML是一种基于XML的标准,可以用来描述复杂的数学公式和符号,使其能够在网页上正确显示。 MathML的…...

数据库取证分析

目录 一.多表关联 1.一对多联结 2.子查询 二.数据库示例分析 1.多表关联 三.选择SQL分析的原因 四.数据库概述 五.SQL语言 一.多表关联 1.一对多联结 2.子查询 二.数据库示例分析 1.多表关联 三.选择SQL分析的原因 四.数据库概述 五.SQL语言 1.select 字段...

MATLAB 批量移动 TIF 文件至分类文件夹

文章目录 前言一、步骤二、代码 前言 本代码用于从指定的源文件夹 (sourceFolder) 中筛选所有 .tif 文件,并根据文件名的特定关键词(Daynight 和 FDI)将其分类移动到相应的目标文件夹 (targetDaynightFolder 和 targetFDIFolder)。 一、步骤…...

【深度技术揭秘】 Android SystemUI锁屏界面动态布局重构:横竖屏智能适配指南

1. 问题背景与需求拆解 在Android 13系统定制中,发现平板横屏锁屏界面存在两大视觉问题: 时钟控件尺寸过大,与竖屏样式不统一 解锁图标位置异常,横向居中而非顶部居中(如图示) 需实现: 横竖屏…...

ESG评级认可性及市场现状分析

ESG评级的认可性是指评级结果在市场上的接受程度和权威性,它直接影响投资者、企业、监管机构等利益相关方对ESG表现的信任和依赖程度。以下是影响ESG评级认可性的关键因素及当前市场现状的分析: 1. 评级机构的权威性 ESG评级的认可性首先取决于评级机构…...

模型解释与可解释AI实战

‌一、为什么需要模型解释?‌ 模型解释技术帮助: 理解模型决策依据(特征重要性)调试模型错误预测满足监管合规要求(金融/医疗)提升用户对AI的信任 本章使用Captum实现CV/NLP模型的可视化解释 ‌二、环境…...

1、pytest基本用法

目录 先给大家分享下学习资源 1. 安装pytest 2. 编写用例规则 3. 执行用例 最近在学习pytest的用法 并且用这套框架替换了原来的unittest, 同是测试框架 确实感觉到pytest更加便捷 这边分享给大家我得学习心得 先给大家分享下学习资源 1 官方文档 pytest 官方…...

【八股文】http怎么建立连接的

http协议的连接建立过程主要基于TCP协议,核心步骤包括TCP连接建立、HTTP协议交互 TCP连接建立 三次握手 客户端与服务器通过TCP协议建立连接,需完成三次握手: SYN包:客户端发送SYN报文,请求建立连接。SYN-ACK包&…...

人工智能AI术语

人工智能(AI)术语是理解人工智能领域的重要组成部分,涵盖了从基础概念到具体技术的广泛内容。这些术语不仅帮助我们理解AI技术的本质,还为研究者、开发者和决策者提供了重要的参考依据。通过掌握这些术语,我们可以更好…...

制作PaddleOCR/PaddleHub的Docker镜像

背景 在落地RAG知识库过程中,遇到了图文识别、图片表格内容识别的需求。但那时(2024年4月)各开源RAG项目还没有集成成熟的解决方案,经调研我选择了百度开源的PaddleOCR。支持国产! 概念梳理 PaddleOCR 百度飞桨的OCR…...

Ubuntu部署Docker搭建靶场

前言 我们需要部署Docker来搭建靶场题目,他可以提供一个隔离的环境,方便在不同的机器上部署,接下来,我会记录我的操作过程,简单的部署一道题目 Docker安装 不推荐在物理机上部署,可能会遇到一些问题&…...

【DFS】羌笛何须怨杨柳,春风不度玉门关 - 4. 二叉树中的深搜

本篇博客给大家带来的是二叉树深度优先搜索的解法技巧,在后面的文章中题目会涉及到回溯和剪枝,遇到了一并讲清楚. 🐎文章专栏: DFS 🚀若有问题 评论区见 ❤ 欢迎大家点赞 评论 收藏 分享 如果你不知道分享给谁,那就分享给薯条. 你们的支持是我不断创作的…...

制作rpm包

使用nfpm制作rpm包,下面是做包使用到的关键文件。 . |-- makefile |-- nfpm.yaml -- scripts |-- postinstall.sh |-- postremove.sh |-- preinstall.sh -- preremove.sh preinstall:在npm install命令前执行 install,postinstal…...