当前位置: 首页 > article >正文

【AI】prompt engineering

prompt engineering ## prompt engineering ## prompt engineering ## prompt engineering

一、定义

Prompt 工程(Prompt Engineering)是指在使用语言模型(如 ChatGPT、文心一言等)等人工智能工具时,设计和优化输入提示(prompts)的过程。这些输入提示是用户向模型提出的文本指令,用于引导模型生成满足特定需求的高质量输出,比如回答问题、生成文本内容(故事、诗歌、代码等)。

二、 概念
样本提示

样本提示是指在prompt engineering过程中,通过向大模型定数量的示例,以便引导大模型生成特定的、高

质量的输出。从提供样本数量的角度,可以分为zero-shot和few-shot,此外我们基于实际使用,增加了一种

新的定义:full-shot,即全量样本。

zero-shotfew-shotfull-shot
定义指在没有提供任何示例的情况下,
利用经过大量数据训练并调整指令
的大型语言模型(LLM)来执行任
务。
few-shot是指通过在提示中提供少量示
例来引导模型进行上下文学习,使大模
型捕获示例的特征,输出更符合预期的
结果。
是指通过枚举所有可能性来制作样
本,输入大模型,让大模型在样本的
范围内返回内容。
prompt举例翻译任务:
请将用户给定的内容进行中文和
英文互译
情感分析:
请分析用户给定内容的情感,属于正
面、负面或者中性,示例:
我今天感觉棒极了!–正面
这真是糟糕透顶的一天。–负面
今天是星期三。–中性
根据用户偏好中每周运动天数安排
周计划的运动日和休息日
{{exercise_days}为0时,每周运
动日应为0天,休息日为7天。
{{exercise_days}为1时,每周运
动日应为1天,休息日为6天。
{{exercise_days}为2时,每周运
动日应为2天,休息日为5天。
{{exercise_days}为3时,每周运
动日应为3天,休息日为4天。
{{exercise_days}为4时,每周运
动日应为4天,休息日为3天。
{{exercise_days}}为5时,每周运
动日应为5天,休息日为2天。
{{exercise_days}为6时,每周运
动日应为6天,休息日为1天。
{{exercise_days}为7时,每周运
动日应为7天,休息日为0天。
使用场景适用于模型已经在大量数据上进行
了训练,能够理解和执行某些任务
的场景。如:
判断内容的情感倾向或者正面/负
适用于模型在没有足够数据的情况下,
难以准确执行任务的场景。如:
物体识别、特征识别
适用于可能性数量较小且确定的场
景,限定大模型自由发挥的空间,确
保生成结果不超出预设范围。
思考方式
  1. Chain - of - Thought (COT)
    • 定义
      • 思维链(Chain - of - Thought)是一种在自然语言处理中用于提升语言模型推理能力的技术。它通过在提示(prompt)中加入中间推理步骤,引导语言模型像人类一样逐步思考并解决问题,而不是直接给出答案。
    • 工作原理
      • 以一个数学文字题为例,如 “小明有 5 个苹果,小红的苹果数是小明的 3 倍少 2 个,问小红有几个苹果?”。传统的 prompt 可能只是简单地将问题输入给语言模型,要求其输出答案。而在 COT 中,prompt 会这样设计:“首先,我们知道小明有 5 个苹果。然后,计算小明苹果数的 3 倍,即 5×3 = 15 个。接着,因为小红的苹果数是小明的 3 倍少 2 个,所以用 15 - 2 = 13 个。所以,小红有 13 个苹果。”
      • 通过这种逐步推理的提示,语言模型能够更好地理解问题的解决逻辑,并且在遇到类似的推理问题时,按照这种思维链模式进行思考和回答。
    • 应用场景
      • 数学和逻辑推理问题:在解决复杂的数学方程式、几何证明以及逻辑谜题等方面表现出色。例如,在证明几何定理时,思维链可以引导模型从已知条件出发,逐步推导出结论。
      • 知识问答和文本理解:对于需要深度理解和推理的知识问答,如历史事件的因果分析、科学原理的解释等,COT 可以帮助模型提供更有条理的回答。例如,在回答 “工业革命对社会结构产生了什么深远影响?” 时,模型可以通过思维链先阐述工业革命带来的生产力变化,再说明这种变化如何导致社会阶层的分化和重组等。
检索增强生成(Retrieval-Augmented Generation, RAG)

检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合信息检索和生成模型的技术,旨在提高生成式模型的准确性和信息丰富性。传统的生成模型(如GPT-3)在生成文本时主要依赖于训练数据中的知识,而检索增强生成通过引入外部知识库或文档库,能够在生成过程中动态获取相关信息,从而生成更为准确和上下文相关的内容。

RAG 的基本流程包括以下几个步骤:

  1. 检索阶段:在生成文本之前,系统会根据输入查询从一个大型的外部文档库中检索出与查询相关的文档或信息片段。这通常使用信息检索技术,如向量检索(如使用 ByteGraph)。
  2. 生成阶段:将检索到的相关文档或信息片段与原始输入一起传递给大语言模型,以生成最终的输出文本。大语言模型会利用这些附加信息来提高生成内容的准确性和相关性。

这种方法的优点在于:

  • 增强知识覆盖:通过访问外部知识库,生成模型可以利用最新的信息,而不局限于训练数据。
  • 提高准确性:检索到的相关信息可以帮助生成模型避免常识性错误或过时的信息。
  • 灵活性:可以根据不同的任务或领域,动态调整检索的文档库,以适应不同的需求。

RAG 在问答系统、对话系统和内容生成等领域有广泛的应用,尤其是在企业内部需要高准确性和实时信息的场景中表现出色。

工具(Tooling)

大语言模型最初主要用于来生成文本。为了增强其功能和实用性,现代大语言模型可以与外部工具(也称为“函数(function)”或“API”)集成。这种集成使得模型能够执行更复杂的任务,超越其原始的文本生成能力。

工具(Tools)通常是外部的API或函数,提供特定的功能或服务。大语言模型可以通过调用这些工具来获取信息或执行特定任务。例如,模型可以调用一个天气API来获取实时天气信息,或者调用一个计算器函数来执行复杂的数学运算。工具的集成与调用包括:

  • API调用:模型通过HTTP请求与外部API进行通信。API通常提供RESTful接口,模型可以发送请求并解析响应。
  • 插件系统:如 Coze 这样的平台为大语言模型提供插件系统和自动化流程系统,使得模型可以动态加载和使用不同的工具。
  • 函数调用:在某些实现中,模型可以直接调用预定义的函数,这些函数可以是本地的或远程的。

大模型工具的使用,可以:

  • 扩展能力:通过工具集成,模型的能力可以大大扩展,能够处理更广泛的任务。
  • 实时性:工具可以提供实时数据和信息,使得模型的输出更加准确和相关。
  • 专业性:通过调用专门的工具,模型可以在特定领域提供更专业和深入的服务。

典型的应用场景包括:

  • 数据查询分析:数据查询分析领域可以执行通过可以执行 SQL 的工具访问企业内部的数据,调用飞书的 API 接口生成飞书文档,并提醒飞书联系人关注。
  • 客户服务:在客户服务中,模型可以调用CRM系统API来获取客户和订单信息,从而提供个性化的服务。
  • 金融分析:在金融领域,模型可以调用市场数据API来分析股票趋势和进行投资建议。
SerpApi: Google Search API

相关文章:

【AI】prompt engineering

prompt engineering ## prompt engineering ## prompt engineering ## prompt engineering 一、定义 Prompt 工程(Prompt Engineering)是指在使用语言模型(如 ChatGPT、文心一言等)等人工智能工具时,设计和优化输入提…...

无需libpacp库,BPF指令高效捕获指定数据包

【环境】无libpacp库的Linux服务器 【要求】高效率读取数据包,并过滤指定端口和ip 目前遇到两个问题 一是手写BPF,难以兼容,有些无法正常过滤二是性能消耗问题,尽可能控制到1% 大方向:过滤数据包要在内核层处理&…...

LeetCode算法题(Go语言实现)_36

题目 给定一个二叉树的根节点 root ,和一个整数 targetSum ,求该二叉树里节点值之和等于 targetSum 的 路径 的数目。 路径 不需要从根节点开始,也不需要在叶子节点结束,但是路径方向必须是向下的(只能从父节点到子节点…...

react实现上传图片到阿里云OSS以及问题解决(保姆级)

一、优势 提高上传速度:前端直传利用了浏览器与 OSS 之间的直接连接,能够充分利用用户的网络带宽。相比之下,后端传递文件时,文件需要经过后端服务器的中转,可能会受到后端服务器网络环境和处理能力的限制,…...

无法看到新安装的 JDK 17

在 Linux 系统中使用 update-alternatives --config java 无法看到新安装的 JDK 17,可能是由于 JDK 未正确注册到系统备选列表中。 一、原因分析 JDK 未注册到 update-alternatives update-alternatives 工具需要手动注册 JDK 路径后才能识别新版本。如果仅安装 JDK…...

LeetCode 3396.使数组元素互不相同所需的最少操作次数:O(n)一次倒序遍历

【LetMeFly】3396.使数组元素互不相同所需的最少操作次数:O(n)一次倒序遍历 力扣题目链接:https://leetcode.cn/problems/minimum-number-of-operations-to-make-elements-in-array-distinct/ 给你一个整数数组 nums,你需要确保数组中的元素…...

Vue2 快速过度 Vue3 教程 (后端学习)

隔好长一段时间没有写文章了,因为最近公司一个项目进度很赶,导致一直加班,没有时间空出来学习新的东西,这次趁着周末,赶紧补一下之前落下的一直想重新学一下整个大前端生态的想法,这次写一篇自己学习Vue3的…...

供应链管理-职业规划:数字化供应链管理专家 / 供应链管理商业模式专家 / 供应链管理方案专家

一、背景阐述 依据联合国产业分类标准,工业体系被细致划分为41个工业大类、207个工业中类以及666个工业小类。中国凭借其独特的产业布局,成为全球唯一一个全面涵盖所有这些门类的国家,成功构建起独立且完备的现代工业体系。这一辉煌成就&…...

无状态版的DHCPv6是不是SLAAC? 笔记250405

无状态版的DHCPv6是不是SLAAC? 笔记250405 无状态版 DHCPv6 不是 SLAAC,但二者在 IPv6 网络中可协同工作。以下是核心区别与协作关系: 本质区别 特性SLAAC无状态 DHCPv6主要功能生成 IPv6 地址(基于路由器通告的前缀)分发 DNS、…...

遍历算法及其应用详解

李升伟 整理 什么是遍历? 遍历是指按照某种规则或顺序,系统地访问数据结构(如树、图等)中的每个节点一次且仅一次的过程。遍历是算法设计中的基本操作,用于访问、检查或修改数据结构中的所有元素。 主要遍历算法 1…...

Python 字典和集合(常见的映射方法)

本章内容的大纲如下: 常见的字典方法 如何处理查找不到的键 标准库中 dict 类型的变种set 和 frozenset 类型 散列表的工作原理 散列表带来的潜在影响(什么样的数据类型可作为键、不可预知的 顺序,等等) 常见的映射方法 映射类型…...

基于大模型的ALS预测与手术优化系统技术方案

目录 技术方案文档:基于大模型的ALS预测与手术优化系统1. 数据预处理与特征工程模块流程图伪代码2. 多模态融合预测模型模型架构图伪代码3. 术中实时监测与动态干预系统系统流程图伪代码4. 统计验证与可解释性模块验证流程图伪代码示例(SHAP分析)5. 健康教育与交互系统系统架…...

创建一个简单的HTML游戏站

创建一个简单的HTML游戏站涉及多个步骤,包括规划网站结构、设计用户界面、编写游戏逻辑以及测试和部署。下面是一个详细的步骤指南: 1. 规划网站结构 确定目标受众:了解你的目标用户群体。选择游戏类型:决定你要开发的游戏类型&…...

Matlab轴承故障信号仿真与故障分析

1.摘要 本文介绍了一个基于Matlab的轴承故障信号仿真与分析程序,旨在模拟和分析轴承内圈故障信号的特征。程序首先通过生成故障信号、共振信号和调制信号,添加噪声和离散化处理,构建模拟的振动信号,并保存相关数据。通过快速傅里…...

Linux 进程 | 概念 / 特征 / 状态 / 优先级 / 空间

注: 本文为 “Linux 进程” 相关文章合辑。 未整理去重。 Linux 进程概念(精讲) A little strawberry 于 2021-10-15 10:23:55 发布 基本概念 课本概念:程序的一个执行实例,正在执行的程序等。 内核观点&#xff…...

项目中如何防止超卖

什么是超卖?假如只剩下一个库存,却被多个订单买到了,简单理解就是库存不够了还能正常下单。 方案1:数据库行级锁 1. 实体类 Data TableName("product") public class Product {TableId(type IdType.AUTO)private Lon…...

重回全面发展亲自操刀

项目场景: 今年工作变动,优化后在一家做国有项目的私人公司安顿下来了。公司环境不如以前,但是好在瑞欣依然可以每天方便的买到。人文氛围挺好,就是工时感觉有点紧,可能长期从事产品迭代开发,一下子转变做项…...

3D珠宝渲染用什么软件比较好?渲染100邀请码1a12

印度珠宝商 Mohar Fine Jewels 和英国宝石商 Gemfields 在今年推出了合作珠宝系列——「Emeralds in Full Bloom」,它的灵感源自花草绽放的春季田野,共有 39 件作品,下面这个以植物为主题的开口手镯就是其中一件。 在数字时代,像这…...

【数据结构】邻接矩阵完全指南:原理、实现与稠密图优化技巧​

邻接矩阵 导读一、图的存储结构1.1 分类 二、邻接矩阵法2.1 邻接矩阵2.2 邻接矩阵存储网 三、邻接矩阵的存储结构四、算法评价4.1 时间复杂度4.2 空间复杂度 五、邻接矩阵的特点5.1 特点1解析5.2 特点2解析5.3 特点3解析5.4 特点4解析5.5 特点5解析5.6 特点6解析 结语 导读 大…...

【嵌入式-stm32电位器控制以及旋转编码器控制LED亮暗】

嵌入式-stm32电位器控制LED亮暗 任务1代码1Key.cKey.hTimer.cTimer.hPWM.cPWM.hmain.c 实验现象1任务2代码2Key.cKey.hmain.c 实验现象2问题与解决总结 源码框架取自江协科技,在此基础上做扩展开发。 任务1 本文主要介绍利用stm32f103C8T6实现电位器控制PWM的占空比…...

ragflow开启https访问:添加证书后,使用浏览器还是有警告,如何解决?

如果在 Windows 系统中安装了 PEM 证书(使用方法一通过证书管理器 MMC 导入),但浏览器仍然提示安全警告,可能有以下几个原因及解决方法: 1. 证书未正确安装到受信任的存储位置 问题:如果证书被导入到错误的存储位置(如“个人”而非“受信任的根证书颁发机构”),浏览器…...

字符串——面试考察高频算法题

目录 转换成小写字母 字符串转化为整数 反转相关的问题 反转字符串 k个一组反转 仅仅反转字母 反转字符串里的单词 验证回文串 判断是否互为字符重排 最长公共前缀 字符串压缩问题 转换成小写字母 给你一个字符串 s ,将该字符串中的大写字母转换成相同的…...

Uniapp 集成极光推送(JPush)完整指南

文章目录 前言一、准备工作1. 注册极光开发者账号2. 创建应用3. Uniapp项目准备 二、集成极光推送插件方法一:使用UniPush(推荐)方法二:手动集成极光推送SDK 三、配置原生平台参数四、核心功能实现1. 获取RegistrationID2. 设置别…...

Plusar集群搭建-Ubuntu20.04-Winterm

1 背景 已经部署了Pulsar集群在生产上,新项目需要用到Pulsar。对Pulsar不熟,故搭建练手。 环境:Windows10vmwareUbuntu20.04,ssh工具使用的Winterm。 使用的是root账户,ubuntu防火墙都ufw disable了。 2 参考文档 集…...

selenium元素获取

from selenium import webdriver from selenium.webdriver.common.by import Bydriver webdriver.Chrome()driver.maximize_window()#最大化窗口 #隐式等待 driver.implicitly_wait(10)#打开网页 driver.get("https://www.zhipin.com/beijing/?kacity-sites-101010100&q…...

AI比人脑更强,因为被植入思维模型【50】邓克效应思维模型

giszz的理解:DK Effect,就是井底之蛙。这里有个启发,就是人的认知提升,有4个阶段,愚昧区、崩溃区、成长区、智慧区。也分别对应4个境界:自然境界、功利境界、道德境界、天地境界。我个人觉得自己刚刚过了崩…...

8、nRF52xx蓝牙学习(boards.h文件学习)

boards.h文件的代码如下: #ifndef BOARDS_H #define BOARDS_H#include "nrf_gpio.h" #include "nordic_common.h"#if defined(BOARD_NRF6310)#include "nrf6310.h" #elif defined(BOARD_PCA10000)#include "pca10000.h" #…...

声明文件.d.ts

在 TypeScript 中,.d.ts 文件是类型声明文件(Declaration Files),用于描述 JavaScript 库或模块的类型信息,但不包含具体实现。它们帮助 TypeScript 编译器进行类型检查,同时保持与纯 JavaScript 的兼容性。…...

java整合socket通信全流程

前言 大家好,由于工作上业务的需要,在java项目中引入了socket通信,特此记录一下,用以备份,本文章中的socket通信实现了,服务端与客户端的双向通讯,以及二者之间的心跳通信,服务端重启之后,客户端的自动重连功能。 原理 Socket通信是计算机网络中常用的一种通信机制…...

2025年常见渗透测试面试题-sql(题目+回答)

网络安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 SQLi 一、发现test.jsp?cid150 注入点的5种WebShell获取思路 1. 文件写入攻击 2. 日志文件劫持 3.…...