当前位置: 首页 > article >正文

spring-ai之Advisors API

1、

Spring AI Advisors API 提供了一种灵活而强大的方法来拦截、
修改和增强 Spring 应用程序中的 AI 驱动的交互。 
通过利用 Advisors API,开发人员可以创建更复杂、可重用和可维护的 AI 组件。主要优势包括封装重复的生成式 AI 模式、转换发送到大型语言模型 (LLM)和从大型语言模型 (LLM) 发送的数据,以及提供跨各种模型和用例的可移植性。
var chatClient = ChatClient.builder(chatModel).defaultAdvisors(new MessageChatMemoryAdvisor(chatMemory), // chat-memory advisornew QuestionAnswerAdvisor(vectorStore)    // RAG advisor).build();String response = this.chatClient.prompt()// Set advisor parameters at runtime.advisors(advisor -> advisor.param("chat_memory_conversation_id", "678").param("chat_memory_response_size", 100)).user(userText).call().content();

2、 

Advisors API 包括CallAroundAdvisor和CallAroundAdvisorChain
对于非流式处理方案,以及StreamAroundAdvisor和
StreamAroundAdvisorChain用于流式处理方案。 它还包括AdvisedRequest
来表示未封装的 Prompt 请求,AdvisedResponse以获取 Chat Completion 
响应。两者都持有advise-context在 advisor chain 中共享状态。

nextAroundCall()和nextAroundStream()是关键的 advisor 方法,
通常执行诸如检查未密封的 Prompt 数据、自定义和扩充 Prompt 数据、调用advisor chain 中的下一个实体、选择性地阻止请求、检查聊天完成响应以及
引发异常以指示处理错误等作。此外,getOrder() method 确定链中的 
advisor 顺序,而getName()提供唯一的 advisor 名称。由 Spring AI 
框架创建的 Advisor 链允许按顺序调用多个 advisor,这些 advisor 
按其getOrder()值。 首先执行较低的值。 自动添加的最后一个 advisor 将请求发送到 LLM。

下图说明了 advisor chain和聊天模型之间的交互

1、The Spring AI framework creates an AdvisedRequest from user’s 
Prompt along with an empty AdvisorContext object.2、Each advisor in the chain processes the request, 
potentially modifying it. Alternatively, it can choose 
to block the request by not making the call to invoke 
the next entity. In the latter case, the advisor is 
responsible for filling out the response.3、The final advisor, provided by the framework, 
sends the request to the Chat Model.4、The Chat Model’s response is then passed back through 
the advisor chain and converted into AdvisedResponse. 
Later includes the shared AdvisorContext instance.5、Each advisor can process or modify the response.6、The final AdvisedResponse is returned to the clientby extracting the ChatCompletion.

    1、Spring AI 创建了一个AdvisedRequest从用户的Prompt
    以及一个空的AdvisorContext对象。2、advisor  chain 中的每个 advisor 都会处理请求,
    并可能对其进行修改。或者,它也可以选择通过不调用下一个实体来阻止请求。
    在后一种情况下,advisor 负责填写回复。3、spring-ai自身提供的 final advisor 则会将请求发送到Chat Model.4、然后,聊天模型的响应通过 advisor 链传回并转换为AdvisedResponse.later 
    包括共享的AdvisorContext实例。5、每个advisor 都可以处理或修改响应。6、final AdvisedResponse通过提取ChatCompletion.

     

    Advisor Order
    The execution order of advisors in the chain is determined 
    by the getOrder() method. Key points to understand:Advisors with lower order values are executed first.The advisor chain operates as a stack:The first advisor in the chain is the first to process the request.It is also the last to process the response.To control execution order:Set the order close to Ordered.HIGHEST_PRECEDENCE to ensure 
    an advisor is executed first in the chain (first for request 
    processing, last for response processing).Set the order close to Ordered.LOWEST_PRECEDENCE to ensure 
    an advisor is executed last in the chain 
    (last for request processing, first for response processing).Higher values are interpreted as lower priority.If multiple advisors have the same order value, 
    their execution order is not guaranteed.

    链中 advisor 的执行顺序由getOrder()方法。需要了解的要点:首先执行 order值较低的Advisors。advisor 链以 stack的形式运行(后进先出(LIFO)):链中的第一个 advisor 是第一个处理请求的人。链中的第一个 advisor 也是最后一个处理响应的服务器。要控制执行顺序:将order设置为 Ordered.HIGHEST_PRECEDENCE确保 advisor 首先在链中执行 
    (first for request processing, last for response processing)。将order设置为 Ordered.LOWEST_PRECEDENCE确保 advisor 在链中最后执行 
    (last for request processing, first for response processing)。较高的值被解释为较低的优先级。如果多个 advisor 具有相同的order值,则不能保证他们的执行顺序。

    Spring AI Built-in Advisors
    Spring AI framework provides several built-in advisors to enhance 
    your AI interactions. Here’s an overview of the available advisors:Chat Memory Advisors
    These advisors manage conversation history in a chat memory store:MessageChatMemoryAdvisorRetrieves memory and adds it as a collection of messages to the 
    prompt. This approach maintains the structure of the conversation 
    history. Note, not all AI Models support this approach.PromptChatMemoryAdvisorRetrieves memory and incorporates it into the prompt’s system text.VectorStoreChatMemoryAdvisorRetrieves memory from a VectorStore and adds it into the prompt’s 
    system text. This advisor is useful for efficiently searching 
    and retrieving relevant information from large datasets.Question Answering Advisor
    QuestionAnswerAdvisorThis advisor uses a vector store to provide question-answering 
    capabilities, implementing the RAG (Retrieval-Augmented Generation) pattern.Content Safety Advisor
    SafeGuardAdvisorA simple advisor designed to prevent the model from generating harmfulor inappropriate content.

    Spring AI 内置顾问程序
    Spring AI 框架提供了几个内置的顾问程序来增强您的 AI 交互。以下是可用顾问的概述:聊天记忆顾问
    这些顾问在聊天内存存储中管理对话历史记录:MessageChatMemoryAdvisor检索内存并将其作为消息集合添加到提示符中。此方法维护会话历史记录的结构。请注意,
    并非所有 AI 模型都支持此方法。PromptChatMemoryAdvisor检索内存并将其合并到提示的系统文本中。VectorStoreChatMemoryAdvisor从 VectorStore 中检索内存,并将其添加到提示符的系统文本中。此 advisor 
    可用于从大型数据集中高效搜索和检索相关信息。问题解答顾问
    QuestionAnswerAdvisor此 advisor 使用向量存储来提供问答功能,实现 RAG(检索增强生成)模式。内容安全顾问
    SafeGuardAdvisor一个简单的 advisor,旨在防止模型生成有害或不适当的内容。

    相关文章:

    spring-ai之Advisors API

    1、 Spring AI Advisors API 提供了一种灵活而强大的方法来拦截、 修改和增强 Spring 应用程序中的 AI 驱动的交互。 通过利用 Advisors API,开发人员可以创建更复杂、可重用和可维护的 AI 组件。主要优势包括封装重复的生成式 AI 模式、转换发送到大型语言模型 &…...

    App爬虫工具篇-mitmproxy

    mitmproxy 是一个支持 HTTP 和 HTTPS 的抓包程序,类似 Fiddler、Charles 的功能,它通过控制台的形式和ui界面的方式 此外,mitmproxy 还有两个关联组件,一个是 mitmdump,它是 mitmproxy 的命令行接口,利用它可以对接 Python 脚本,实现监听后的处理;另一个是 mitmweb,它…...

    JVM 系列:JVM 内存结构深度解析

    你点赞了吗?你关注了吗?每天分享干货好文。 高并发解决方案与架构设计。 海量数据存储和性能优化。 通用框架/组件设计与封装。 如何设计合适的技术架构? 如何成功转型架构设计与技术管理? 在竞争激烈的大环境下&#xff0c…...

    【回眸】Tessy集成测试软件使用指南(一)新手使用篇

    前言 这个专栏的文章前4篇都在记录如何使用Tessy进行单元测试,集成测试需要有一定单元测试基础,且做集成测试之前,需要做好单元测试,否则将会大幅增加软件单元代码纠错的代价。集成测试所花费的时间通常远远超过单元测试。如果直…...

    ROS 快速入门教程02

    5. Node 节点 以智能手机为例,当我们使用智能手机的某个功能时,大多时候在使用手机的某个APP。同样当我们使用ROS的某个功能时,使用的是ROS的某一个或者某一些节点。 虽然每次我们只使用ROS的某一个或者某一些节点,但我们无法下…...

    vue+django+LSTM微博舆情分析系统 | 深度学习 | 食品安全分析

    文章结尾部分有CSDN官方提供的学长 联系方式名片 文章结尾部分有CSDN官方提供的学长 联系方式名片 关注B站,有好处! 编号: D031 LSTM 架构:vuedjangoLSTMMySQL 功能: 微博信息爬取、情感分析、基于负面消极内容舆情分析…...

    HCIP实验二(OSPF网络配置与优化)

    一.拓扑图与题目 1.R5为ISP,其上只能配置IP地址; R5与其他所有直连设备间均使用公有IP;环回地址为100.1.1.1/3 2.R4设备为企业出口路由器 3.整个0SPF环境IP基于172.16.0.0/16划分 4.所有设备均可访问R5的环回; 5.减少LSA的更新里,加快收敛&#xff0…...

    【阿里云大模型高级工程师ACP习题集】2.3 优化提示词改善答疑机器人回答质量

    练习题: 【单选题】在使用大模型进行意图识别时,通过设计特定提示词引导模型生成符合预期回答的方法,其本质是( )。 A. 修改模型本身参数 B. 依靠构造输入激发模型内部已有知识 C. 对模型进行微调 D. 改变模型的训练数据 【多选题】以下哪些属于提示词框架中的要素( )。…...

    Python内置函数---bytes()

    用于创建不可变的字节序列对象 1. 基本语法与参数 bytes(sourceb, encodingNone, errorsNone) - 参数: - source:可选参数,指定初始化数据来源,可以是以下类型: - 整数:创建指定长度的空字节序列&#xff…...

    K8S的service详解

    一。service的介绍 在K8S中,pod是访问应用程序的载体,我们可以通过pod的ip来访问应用程序,但是pod的ip地址不是固定的,这也意味着不方便直接采用pod的ip对服务进行访问,为了解决这个问题,K8S提供了service…...

    数据结构初阶:二叉树(四)

    概述:本篇博客主要介绍链式结构二叉树的实现。 目录 1.实现链式结构二叉树 1.1 二叉树的头文件(tree.h) 1.2 创建二叉树 1.3 前中后序遍历 1.3.1 遍历规则 1.3.1.1 前序遍历代码实现 1.3.1.2 中序遍历代码实现 1.3.1.3 后序遍历代…...

    配置Intel Realsense D405驱动与ROS包

    配置sdk使用 Ubuntu20.04LTS下安装Intel Realsense D435i驱动与ROS包_realsense的驱动包-CSDN博客 中的方法一 之后不通过apt安装包,使用官方的安装步骤直接clone https://github.com/IntelRealSense/realsense-ros/tree/ros1-legacy 从这一步开始 执行完 这一步…...

    Python爬虫实战:基于 Python Scrapy 框架的百度指数数据爬取研究

    一、引言 1.1 研究背景 在当今信息时代,市场调研和趋势分析对于企业和研究机构至关重要。百度指数能够精准反映关键词在百度搜索引擎上的热度变化情况,为市场需求洞察、消费者兴趣分析等提供了极具价值的数据支持。通过对百度指数数据的爬取和分析,企业可以及时调整营销策略…...

    【Easylive】consumes = MediaType.MULTIPART_FORM_DATA_VALUE 与 @RequestPart

    【Easylive】项目常见问题解答(自用&持续更新中…) 汇总版 consumes MediaType.MULTIPART_FORM_DATA_VALUE 的作用 1. 定义请求的数据格式 • 作用:告诉 Feign 和 HTTP 客户端,这个接口 接收的是 multipart/form-data 格式的…...

    【最新版】沃德代驾源码全开源+前端uniapp

    一.系统介绍 基于ThinkPHPUniapp开发的代驾软件。系统源码全开源,代驾软件的主要功能包括预约代驾、在线抢单、一键定位、在线支付、车主登记和代驾司机实名登记等‌。用户可以通过小程序预约代驾服务,系统会估算代驾价格并推送附近代驾司机供用户选择&…...

    前端频繁调用后端接口问题思考

    针对前端频繁调用后端接口的问题,以下是一套分步解决方案,结合Java后端技术栈: 1. 实时数据场景:WebSocket/SSE 适用场景:实时股票行情、即时聊天、监控仪表盘 // Spring WebSocket 配置示例 Configuration EnableW…...

    Linux:权限相关问题

    文章目录 shell命令以及运行的原理Linux权限执行权限更改目录权限缺省权限粘滞位 shell命令以及运行的原理 操作系统分为内核和外壳程序,xshell是外壳程序,外壳程序包括我们windows桌面上的图形化界面,本质都是翻译给核心处理,再显…...

    AI数字人:元宇宙舞台上的闪耀新星(7/10)

    摘要:AI数字人作为元宇宙核心角色,提升交互体验,推动内容生产变革,助力产业数字化转型。其应用场景涵盖虚拟社交、智能客服、教育、商业营销等,面临技术瓶颈与行业规范缺失等挑战,未来有望突破技术限制&…...

    【Linux】冯诺依曼体系结构及操作系统架构图的具体剖析

    目录 一、冯诺依曼体系结构 1、结构图 2、结构图介绍: 3、冯诺依曼体系的数据流动介绍 4、为什么在该体系结构中要存在内存? 二、操作系统架构图介绍 1、操作系统架构图 2、解析操作系统架构图 3、为什么要有操作系统? 前些天发现了一…...

    算法训练营第一天|704.二分查找、27.移除元素、977.有序数组的平方

    数组理论基础 1.数组是存放在连续内存空间上的相同类型数据的集合。 2.数组的元素是不能删除的,只能覆盖。 3.不同语言不一样,在C中,二维数组是连续分布的 704.二分查找 题目 思路与解法 第一想法: 简单的二分查找&#xff0c…...

    c++ 互斥锁

    为练习c 线程同步,做了LeeCode 1114题. 按序打印: 给你一个类: public class Foo {public void first() { print("first"); }public void second() { print("second"); }public void third() { print("third"…...

    3.1 Agent定义与分类:自主Agent、协作Agent与混合Agent的特点

    随着人工智能技术的快速发展,智能代理(Agent)作为一种能够感知环境、自主决策并采取行动的计算实体,已成为人工智能领域的重要研究对象和应用工具。特别是在大模型(Large Models)的赋能下,Agent…...

    什么是CAN的非破坏仲裁?

    ‌CAN总线的非破坏性仲裁‌是一种在多个设备同时发送数据时,通过标识符(ID)优先级来决定哪个设备可以优先发送数据的机制。其核心思想是:当多个设备同时发送数据时,ID值较小的数据具有更高的优先级,能够优先…...

    Vite vs Webpack 优势对比

    Vite vs Webpack 优势对比 核心优势图解 #mermaid-svg-jeTCEp1bu9QruHjL {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-jeTCEp1bu9QruHjL .error-icon{fill:#552222;}#mermaid-svg-jeTCEp1bu9QruHjL .error-text{…...

    中波红外相机的应用领域及介绍

    科技日新月异,无人机技术在众多领域已显露其卓越性能。当中波红外相机与无人机携手合作,安防视频监控和精细巡检便迎来了颠覆性的变革。本文旨在深入剖析无人机搭载中波红外相机的技术优势、广阔应用前景及实际案例,以此彰显其不可估量的潜力…...

    【C++】vector扩容缩容

    vector扩容缩容 1 扩容 一般来说&#xff0c;主要是重新分配内存 2 缩容 resize 缩小后&#xff0c;vector 的容量&#xff08;capacity()&#xff09;可能保持不变&#xff0c;需要显式调用 shrink_to_fit() 来释放内存。 验证代码&#xff1a; #include <vector>…...

    240423 leetcode exercises

    240423 leetcode exercises jarringslee 文章目录 240423 leetcode exercises[33. 搜索旋转排序数组](https://leetcode.cn/problems/search-in-rotated-sorted-array/)&#x1f501;先找旋转点 再分段二分&#x1f501;利用布尔变量进行一次二分 [LCR 009. 乘积小于 K 的子数…...

    重装系统 之 Dell戴尔服务器 PowerEdge R750xs + window server2012r2 || 2016

    因要求需要给新服务器装个 win server2012或者2016系统 XXX使用U盘制作PE系统U盘安装系统不行&#xff0c;适合普通win8&#xff0c;win10&#xff0c;win11U盘制作PE系统U盘安装win10系统教程U盘制作PE系统U盘安装win10系统教程https://mp.weixin.qq.com/s/t0W8aNJaHPAU8T78nh…...

    7-1 三种语言的单词转换

    编写程序实现&#xff1a;首先从键盘输入若干个中文与英文单词的偶对&#xff0c;以空行作结束标记&#xff1b;再输入若干个英文与丹麦文单词的偶对&#xff0c;以空行作结束标记。然后输入一个中文单词&#xff0c;输出对应的丹麦文单词&#xff1b;若不存在该单词&#xff0…...

    深度学习--卷积神经网络调整学习率

    文章目录 前言一、学习率1、什么学习率2、什么是调整学习率3、目的 二、调整方法1、有序调整1&#xff09;有序调整StepLR(等间隔调整学习率)2&#xff09;有序调整MultiStepLR(多间隔调整学习率)3&#xff09;有序调整ExponentialLR (指数衰减调整学习率)4&#xff09;有序调整…...