当前位置: 首页 > news >正文

《深入浅出LLM基础篇》(五):Propmt工程优化

在这里插入图片描述

🎉AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高! 限时优惠加入星球➡️点击链接

专栏介绍: 本作者推出全新系列《深入浅出LLM》专栏,将分为基础篇、进阶篇、实战篇等,本文为基础篇具体章节如导图所示(导图为常见LLM问题,导图专栏后续更新!),将分别从各个大模型模型的概念、经典模型、创新点、微调、分布式训练、数据集、未来发展方向、RAG、Agent及项目实战等各种角度展开详细介绍,欢迎大家关注。

👨‍💻作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。✨公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或➡️点击链接 加群。

《深入浅出LLM基础篇》目录

《深入浅出LLM基础篇》(一):大模型概念与发展
《深入浅出LLM基础篇》(二):大模型基础知识
《深入浅出LLM基础篇》(三):大模型结构分类
《深入浅出LLM基础篇》(四):主流大模型分类介绍
《深入浅出LLM基础篇》(五):Propmt工程优化

《深入浅出LLM基础篇》(五):Propmt工程优化

导读:本篇为《《深入浅出LLM基础篇》(五):Propmt工程优化,主要讨论各自Propmt优化的tips,与效果差进行对比展示。由于 OpenAI模型的训练方式,特定的提示格式效果特别好,可以产生更有用的模型输出。OpenAI 的官方提示工程指南通常是提示技巧的最佳起点,大家有好的也可以在评论区交流学习。

注:本文参考 OpenAI API 进行快速工程的最佳实践

下面开始正式介绍一些效果很好的提示格式,但您可以随意探索不同的格式,它们可能更适合您的任务。

在这里插入图片描述

经验法则和示例

注意:“ {此处输入文本} ”是实际文本/上下文的占位符

1.使用最新模型

为了获得最佳效果,我们通常建议使用最新、性能最强的模型。较新的模型往往更容易提示工程师。

2. 将指令放在提示符的开头,并使用###或“”将指令和上下文分开

效果较差❌:
将下面的文字总结为最重要的要点列表。

{在此处输入文本}

更好✅:
将下面的文字总结为最重要的要点列表。

文字:“”
{在此处输入文本}
“”

3. 尽可能具体、详细地描述所需的背景、结果、长度、格式、风格等

具体说明背景、结果、长度、格式、风格等

效果较差❌:
写一首关于 OpenAI 的诗。

更好✅:
以{著名诗人}的风格写一首关于 OpenAI 的简短励志诗,重点介绍最近的 DALL-E 产品发布(DALL-E 是一个文本到图像的 ML 模型)

4. 通过示例阐明所需的输出格式

效果较差❌:
提取以下文本中提到的实体。提取以下 4 种实体类型:公司名称、人名、特定主题和主题。

文本:{text}
展示并说明 - 当展示特定格式要求时,模型会做出更好的响应。这也使得以编程方式可靠地解析多个输出变得更加容易。

更好✅:
提取下面文本中提到的重要实体。首先提取所有公司名称,然后提取所有人名,然后提取符合内容的特定主题,最后提取一般的总体主题

所需格式:
公司名称:<comma_separated_list_of_company_names>
人名:-||-
特定主题:-||-
一般主题:-||-

文本:{text}

5. 从零样本开始,然后是少样本,都不起作用,然后进行微调

✅ Zero shot
从以下文本中提取关键字。

文本:{text}

关键字:

✅ 小样本few shots - 提供几个示例
从下面相应的文本中提取关键词。

文本 1:Stripe 提供 API,Web 开发人员可以使用这些 API 将支付处理集成到他们的网站和移动应用程序中。
关键词 1:Stripe、支付处理、API、Web 开发人员、网站、移动应用程序

文本 2:OpenAI 训练了非常擅长理解和生成文本的尖端语言模型。我们的 API 提供对这些模型的访问,可用于解决几乎任何涉及处理语言的任务。
关键词 2:OpenAI、语言模型、文本处理、API。

文本 3:{text}
关键词 3:

✅微调:在此处查看微调最佳实践。

6. 减少“空洞”和不精确的描述

效果较差❌:
该产品的描述应该比较简短,只有几句话,不要太多。

更好✅:
使用3到5个句子的段落来描述该产品。

7. 不要只说不该做什么,而要说该做什么

效果较差❌:
以下是代理与客户之间的对话。请勿询问用户名或密码。请勿重复。

客户:我无法登录我的帐户。
代理:

更好✅:
以下是代理与客户之间的对话。代理将尝试诊断问题并提出解决方案,同时避免询问任何与 PII 相关的问题。不要询问 PII(例如用户名或密码),而是让用户参考帮助文章 www.samplewebsite.com/help/faq

客户:我无法登录我的帐户。
代理:

8. 代码生成专用 - 使用“引导词”推动模型向特定模式发展

效果较差❌:

编写一个简单的 Python 函数,

  1. 询问我一个英里数
  2. 将英里转换为公里

在下面的代码示例中,添加“ import ”提示模型应该开始用 Python 编写。(类似地,“ SELECT ”是 SQL 语句开头的一个很好的提示。)

更好✅:

编写一个简单的 Python 函数,

  1. 询问我一个英里数
  2. 将英里转换为公里

import

9. 使用“生成任何内容”功能

可以使用“生成任何内容”功能来描述任务或预期的自然语言输出并接收定制的提示。

参数

通常,我们发现model和是改变模型输出最常用的参数。temperature

  1. model-性能更高的型号通常更昂贵,并且可能具有更高的延迟。
  2. temperature-衡量模型输出不太可能的标记的频率。 越高temperature,输出越随机(通常越有创意)。 但是,这与“真实性”不同。 对于大多数事实用例(例如数据提取和真实的问答),temperature0 是最好的。
  3. max_tokens(最大长度) - 不控制输出的长度,而是对 token 生成的硬性截止限制。理想情况下,您不会经常达到此限制,因为您的模型会在它认为完成时或达到您定义的停止序列时停止。
  4. stop(停止序列) - 一组字符(标记),当生成时,将导致文本生成停止。
    其他参数说明请参见API参考。

propmt参考学习资料

https://learnprompting.org/zh-Hans/docs/introduction

相关文章:

《深入浅出LLM基础篇》(五):Propmt工程优化

&#x1f389;AI学习星球推荐&#xff1a; GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料&#xff0c;配有全面而有深度的专栏内容&#xff0c;包括不限于 前沿论文解读、…...

基于WebSocket实现简易即时通讯功能

代码实现 pom.xml <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId> </dependency> <dependency><groupId>org.springframework.boot</groupId><artifa…...

2012年国赛高教杯数学建模D题机器人避障问题解题全过程文档及程序

2012年国赛高教杯数学建模 D题 机器人避障问题 图1是一个800800的平面场景图&#xff0c;在原点O(0, 0)点处有一个机器人&#xff0c;它只能在该平面场景范围内活动。图中有12个不同形状的区域是机器人不能与之发生碰撞的障碍物&#xff0c;障碍物的数学描述如下表&#xff1a…...

Linux驱动开发——设备树

文章目录 1 什么是设备树&#xff1f;2 DTS、DTB和DTC3 DTS语法3.1 dtsi头文件3.2 设备节点3.3 标准属性3.4 根节点compatible属性3.5 向节点追加或修改内容 4 创建小型模板设备树5 设备树在系统中的体现6 绑定信息文档7 设备树常用OF操作函数7.1 查找节点的OF函数7.2 查找父/子…...

spring boot 2.7整合Elasticsearch Java client + ingest attachment实现文档解析

一、软件环境 软件版本号备注Spring boot2.7.23.x版本建议使用ElasticSearch8.xElasticSearch7.17.4ElasticSearch 7.x 可使用JDK 8 ElasticSearch 8.x 要求使用JDK 11 二、安装ElasticSearch 下载地址&#xff1a;https://artifacts.elastic.co/downloads/elasticsearch/el…...

一、PyCharm 基本快捷键总结

PyCharm 快捷键 前言一、编辑&#xff08;Editing&#xff09;二、查找/替换(Replace)三、运行(Running)四、重构(Refactoring)五、基本(General) 前言 下面我们将学习一些 Pycharm 中的快捷键来帮我们更好的使用工具。 一、编辑&#xff08;Editing&#xff09; 快捷键快捷键…...

Windows系统C盘爆满了,如何清理?

Windows系统C盘爆满了&#xff0c;如何清理&#xff1f; 大家好&#xff0c;我是秋意零。 相信使用过Windows系统的朋友&#xff0c;都见过C盘那道靓丽的 “红色风景线” &#xff01; 我自己的Win10系统&#xff0c;已经使用了4-5年时间了。最近频频出现"红色风景线&q…...

【C++】踏上C++学习之旅(一):初识C++和命名空间

文章目录 前言1. 初识C2. C的发展阶段2. 命名空间2.1 为什么要有命名空间&#xff1f;2.2 命名空间的语法2.3 命名空间的原理2.4 使用命名空间的三种方式2.4.1 加命名空间名称及作用域限定符( :: )2.4.2 使用using关键字将命名空间中某个成员 引入2.4.3 使用using namespace 命…...

tensorflow入门案例手写数字识别人工智能界的helloworld项目落地1

参考 https://tensorflow.google.cn/?hlzh-cn https://tensorflow.google.cn/tutorials/keras/classification?hlzh-cn 项目资源 https://download.csdn.net/download/AnalogElectronic/89872174 文章目录 一、案例学习1、导入测试和训练数据集&#xff0c;定义模型&#xff…...

深度学习——线性神经网络(三、线性回归的简洁实现)

目录 3.1 生成数据集3.2 读取数据集3.3 定义模型3.4 初始化模型参数3.5 定义损失函数3.6 定义优化算法3.7 训练 在上一节中&#xff0c;我们通过张量来自定义式地进行数据存储和线性代数运算&#xff0c;并通过自动微分来计算梯度。实际上&#xff0c;由于数据迭代器、损失函数…...

本地部署 Milvus

本地部署 Milvus 1. Install Milvus in Docker2. Install Attu, an open-source GUI tool 1. Install Milvus in Docker curl -sfL https://raw.githubusercontent.com/milvus-io/milvus/master/scripts/standalone_embed.sh -o standalone_embed.shbash standalone_embed.sh …...

Git基础-配置http链接的免密登录

问题描述 当我们在使用 git pull 或者 git push 进行代码拉取或代码提交时&#xff0c; 若我们的远程代码仓库是 http协议的链接时&#xff0c;就是就会提示我们进行账号密码的登录。 每次都要登录&#xff0c;这未免有些麻烦。 本文介绍一下免密登录的配置。解决方案 1 执行…...

华为OD机试真题-编码能力提升-2024年OD统一考试(E卷)

最新华为OD机试考点合集:华为OD机试2024年真题题库(E卷+D卷+C卷)_华为od机试题库-CSDN博客 每一题都含有详细的解题思路和代码注释,精编c++、JAVA、Python三种语言解法。帮助每一位考生轻松、高效刷题。订阅后永久可看,持续跟新。 题目描述 为了提升软件编码能力,小…...

高被引算法GOA优化VMD,结合Transformer-SVM的轴承诊断,保姆级教程!

本期采用2023年瞪羚优化算法优化VMD&#xff0c;并结合Transformer-SVM实现轴承诊断&#xff0c;算是一个小创新方法了。需要水论文的童鞋尽快&#xff01; 瞪羚优化算法之前推荐过&#xff0c;该成果于2023年发表在计算机领域三区SCI期刊“Neural Computing and Applications”…...

半小时速通RHCSA

1-7章: #01创建以上目录和文件结构&#xff0c;并将/yasuo目录拷贝4份到/目录下 #02查看系统合法shell #03查看系统发行版版本 #04查看系统内核版本 #05临时修改主机名 #06查看系统指令的查找路径 #07查看passwd指令的执行路径 #08为/yasuo/ssh_config文件在/mulu目录下创建软链…...

人工智能和机器学习之线性代数(一)

人工智能和机器学习之线性代数&#xff08;一&#xff09; 人工智能和机器学习之线性代数一将介绍向量和矩阵的基础知识以及开源的机器学习框架PyTorch。 文章目录 人工智能和机器学习之线性代数&#xff08;一&#xff09;基本定义标量&#xff08;Scalar&#xff09;向量&a…...

STM32外设应用详解

STM32外设应用详解 STM32微控制器是意法半导体&#xff08;STMicroelectronics&#xff09;推出的一系列基于ARM Cortex-M内核的高性能、低功耗32位微控制器。它们拥有丰富的外设接口和功能模块&#xff0c;可以满足各种嵌入式应用需求。本文将详细介绍STM32的外设及其应用&am…...

docker详解介绍+基础操作 (三)优化配置

1.docker 存储引擎 Overlay&#xff1a; 一种Union FS文件系统&#xff0c;Linux 内核3.18后支持 Overlay2&#xff1a;Overlay的升级版&#xff0c;docker的默认存储引擎&#xff0c;需要磁盘分区支持d-type功能&#xff0c;因此需要系统磁盘的额外支持。 关于 d-type 传送…...

细说Qt的状态机框架及其用法

文章目录 使用场景基本用法状态定义添加转换历史状态QStateMachine是Qt框架中用于构建状态机的一个类,它属于Qt的状态机框架(State Machine Framework)。这个框架提供了一种模型,用于设计响应不同事件(如用户输入、文件I/O或网络活动)的应用程序的行为。通过使用状态机,开发…...

Oracle-表空间与数据文件操作

目录 1、表空间创建 2、表空间修改 3、数据文件可用性切换操作 4、数据文件和表空间删除 1、表空间创建 &#xff08;1&#xff09;为 ORCL 数据库创建一个名为 BOOKTBS1 的永久表空间&#xff0c;数据文件为d:\bt01.dbf &#xff0c;大小为100M&#xff0c;区采用自动扩展…...

子网掩码实战:从原理到网络规划的深度解析

1. 子网掩码的核心原理 第一次接触子网掩码时&#xff0c;我也被那一串数字搞得晕头转向。直到有次公司网络改造&#xff0c;亲眼看到老工程师用子网划分解决了IP地址不足的问题&#xff0c;才真正明白它的价值。简单来说&#xff0c;子网掩码就像邮局的邮政编码系统 - 它告诉网…...

ARM PMU中断控制寄存器PMINTENCLR/PMINTENSET详解

1. ARM性能监控单元(PMU)架构概述 在现代处理器设计中&#xff0c;性能监控单元(Performance Monitoring Unit, PMU)是实现系统级性能分析和优化的关键组件。ARM架构从v7开始引入标准化的PMU设计&#xff0c;并在v8/v9架构中持续演进。PMU的核心功能是通过一组可编程事件计数器…...

自动驾驶-数据解析01:四元数04【nuPlan 数据集中的 ego2global_rotation 四元数是采集时生成的,还是后期处理得到的?】

标题:nuPlan 数据集中的 ego2global_rotation 四元数是采集时生成的,还是后期处理得到的? 1. 先给结论 在讨论 nuPlan 数据集中的自车姿态四元数时,不能简单地说: 它一定是车辆采集瞬间直接生成的原始四元数。也不能简单地说: 它是后期人工标注生成的四元数。更准确的…...

ARMv8系统寄存器详解与L2MERRSR_EL1应用

1. ARM系统寄存器概述在ARMv8架构中&#xff0c;系统寄存器是处理器内部用于控制和监控CPU运行状态的关键组件。这些寄存器不同于通用寄存器&#xff0c;它们专门用于系统级操作&#xff0c;如内存管理、异常处理、性能监控等。系统寄存器通过特定的指令进行访问&#xff0c;在…...

你的群晖NAS性能过剩了吗?试试用它跑个万兆测速服务,榨干内网带宽

如何用群晖NAS搭建专业级内网测速平台&#xff1a;从硬件压榨到性能调优全指南 当你为家庭或工作室部署了万兆网络环境后&#xff0c;最令人抓狂的莫过于花了大价钱升级设备&#xff0c;却无法确认实际带宽是否达标。那些标榜"万兆兼容"的交换机、网卡和NAS&#xff…...

开源机械爪应用宝库:从视觉分拣到项目实战全解析

1. 项目概述&#xff1a;一个开源“机械爪”用例的灵感宝库如果你对机器人、自动化或者开源硬件感兴趣&#xff0c;最近在GitHub上闲逛时&#xff0c;可能刷到过一个叫hesamsheikh/awesome-openclaw-usecases的仓库。光看名字&#xff0c;就能猜个八九不离十&#xff1a;这是一…...

创业团队如何用Taotoken低成本试验多个AI模型

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 创业团队如何用Taotoken低成本试验多个AI模型 对于资源有限的创业团队而言&#xff0c;在开发产品原型或验证AI功能时&#xff0c;…...

构建多模型备用策略时Taotoken的聚合与路由能力价值

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 构建多模型备用策略时Taotoken的聚合与路由能力价值 在构建依赖大模型能力的生产应用时&#xff0c;服务的稳定性是核心考量之一。…...

为什么92%的AIGC剪辑师仍在用手动导出?揭秘Sora 2直连Premiere的7大底层优化与3个避坑红线

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;Sora 2与Premiere直连整合的行业悖论与破局起点 当OpenAI正式释放Sora 2的API文档并开放有限开发者预览时&#xff0c;Adobe Premiere Pro团队内部立即启动了“Project Lumen”——一项旨在实现双向帧级…...

Linux重定向与管道:从文件描述符到高效命令行工作流

1. 项目概述&#xff1a;为什么重定向是命令行的效率倍增器&#xff1f;如果你在Linux命令行里混过一段时间&#xff0c;肯定遇到过这样的场景&#xff1a;想看看一个命令的输出&#xff0c;结果屏幕刷地一下滚过去几百行&#xff0c;关键信息一闪而过&#xff1b;或者想把一个…...