当前位置: 首页 > article >正文

Java: 手动实现DeepSeek R1工具调用,基于ReAct与Spring AI的实践指南

1. DeepSeek R1工具调用的现状与挑战DeepSeek R1作为当前热门的开源大模型在实际应用中经常会遇到需要调用外部工具的场景。但很多开发者在使用过程中发现当前版本的DeepSeek R1并不支持原生的工具调用功能。这意味着当我们想让模型执行诸如查询天气、计算数学公式、调用数据库等操作时模型本身无法直接完成这些任务。我在实际项目中也遇到了这个问题。比如需要开发一个智能客服系统当用户询问北京明天天气怎么样时理想情况是模型能自动调用天气API获取数据。但直接使用DeepSeek R1会发现它只能给出类似我可以帮你查询天气这样的回应而无法真正执行查询操作。这种情况下的核心痛点在于模型无法识别何时需要调用工具即使识别了需求也没有标准化的方式来触发工具执行工具执行结果无法有效反馈给模型进行后续处理好消息是DeepSeek官方已经在GitHub上确认下一个大版本会支持原生工具调用功能。但对于急需该功能的开发者来说等待可能不是最佳选择。这就引出了我们今天要讨论的主题如何基于ReAct思想和Spring AI框架手动实现工具调用功能。2. ReAct思想解析与提示词设计2.1 什么是ReAct模式ReAct(Reasoning and Acting)是一种让大模型能够进行推理和行动的技术框架。它的核心思想是将问题解决过程分解为思考-行动-观察的循环思考(Thought): 模型分析当前情况决定下一步行动行动(Action): 模型选择执行某个工具或直接回答观察(Observation): 获取行动结果作为下一轮思考的输入这种模式特别适合DeepSeek R1这类不支持原生工具调用的模型。我曾在电商推荐系统中应用这个模式让模型能够根据用户查询调用商品数据库效果相当不错。2.2 提示词设计要点要让DeepSeek R1按照ReAct模式工作关键在于设计严格的提示词。以下是经过我多次调试后的优化版本{ action: weather_query, action_input: { location: 北京, date: 2023-11-20 } }提示词中需要明确几个关键部分工具定义清晰列出所有可用工具及其参数格式响应格式严格规定模型必须返回的JSON结构流程控制明确思考-行动-观察的循环机制在实际应用中我发现中文提示词对DeepSeek R1的效果更好。可能是因为模型对中文的理解更深入出错率明显低于英文提示词。3. Spring AI框架集成实践3.1 Spring AI工具调用基础Spring AI提供了完善的工具调用支持即使底层模型(如DeepSeek R1)不原生支持也能通过框架层实现。我在项目中主要使用了以下核心组件Tool接口定义工具的基本契约ToolExecutor负责实际执行工具调用ToolCallListener监听工具调用事件一个简单的天气查询工具实现如下Bean public Tool weatherTool() { return new Tool() { Override public String getName() { return weather_query; } Override public String getDescription() { return 查询指定地点和日期的天气情况; } Override public Object execute(MapString, Object inputs) { // 实际调用天气API的逻辑 return weatherService.query( (String)inputs.get(location), (String)inputs.get(date) ); } }; }3.2 工具执行流程控制完整的工具调用流程可以分为以下几个步骤初始化对话设置系统提示词包含工具定义和ReAct规则用户提问接收用户输入触发模型推理解析响应从模型输出中提取JSON action工具执行根据action调用相应工具结果反馈将工具结果作为观察输入下一轮对话循环处理重复直到获得Final Answer这个流程中最大的挑战是保持对话上下文的一致性。我的经验是每次工具调用后需要将完整的思考-行动-观察记录添加到对话历史中。4. 完整实现示例与优化技巧4.1 端到端实现代码下面是一个完整的Spring Boot应用示例展示如何集成DeepSeek R1与工具调用RestController public class ToolController { Autowired private ChatClient chatClient; PostMapping(/ask) public String askQuestion(RequestBody String question) { // 初始化对话 ListMessage messages new ArrayList(); messages.add(new SystemMessage(REACT_PROMPT)); messages.add(new UserMessage(question)); // 对话循环 while (true) { ChatResponse response chatClient.call(messages); String content response.getContent(); // 解析JSON action JsonNode action parseAction(content); if (action null) { return 无法解析模型响应; } // 检查是否为最终答案 if (Final Answer.equals(action.get(action).asText())) { return action.get(action_input).asText(); } // 执行工具 String toolName action.get(action).asText(); JsonNode toolInput action.get(action_input); Object toolResult toolExecutor.execute(toolName, toolInput); // 更新对话上下文 messages.add(new AssistantMessage(content)); messages.add(new UserMessage(Observation: toolResult)); } } }4.2 性能优化经验在实际使用中我发现几个可以显著提升效果的方法温度参数调整将temperature设为0.3-0.5之间减少随机性结果后处理添加JSON格式校验和自动修正逻辑超时控制设置合理的超时时间避免无限循环工具缓存对工具结果进行缓存减少重复调用有一次在金融项目中因为没有设置超时控制导致模型陷入思考循环差点引发服务雪崩。这个教训让我意识到流程控制的重要性。5. 常见问题与解决方案在实现过程中开发者常会遇到一些典型问题。根据我的经验以下是几个最常见的情况及其解决方法5.1 模型不遵循JSON格式这是初期最常见的问题。解决方案包括在提示词中强化格式要求添加输出后处理自动修正小错误使用更精确的停止词(stop words)我开发了一个简单的格式修正工具可以自动处理缺失引号、括号等常见问题效果很好。5.2 工具选择不准确有时模型会选择错误的工具。改进方法提供更详细的工具描述在提示词中添加工具选择示例实现工具相似度匹配在电商项目中我通过添加工具使用示例将准确率从70%提升到了92%。5.3 循环次数过多ReAct模式可能导致无限循环。控制方法设置最大循环次数(通常3-5次足够)监控思考内容的重复性添加循环检测逻辑经过多次测试我发现大多数任务在3次循环内都能完成超过5次往往意味着出现了问题。

相关文章:

Java: 手动实现DeepSeek R1工具调用,基于ReAct与Spring AI的实践指南

1. DeepSeek R1工具调用的现状与挑战 DeepSeek R1作为当前热门的开源大模型,在实际应用中经常会遇到需要调用外部工具的场景。但很多开发者在使用过程中发现,当前版本的DeepSeek R1并不支持原生的工具调用功能。这意味着当我们想让模型执行诸如查询天气、…...

League-Toolkit:3个核心功能解决英雄联盟玩家的日常痛点

League-Toolkit:3个核心功能解决英雄联盟玩家的日常痛点 【免费下载链接】League-Toolkit 兴趣使然的、简单易用的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 还在为英雄联…...

Stable Diffusion炼丹指南:从Classifier Guidance到Classifier-Free Guidance,一文搞懂两种主流引导方式的区别与实战选择

Stable Diffusion条件生成实战:Classifier Guidance与Classifier-Free Guidance深度解析 在AIGC技术爆发的今天,Stable Diffusion等开源模型已成为内容创作的重要工具。但当你需要精确控制生成结果时——比如指定生成"穿红色连衣裙的亚洲女性"…...

从航拍影像到三维地形:OpenDroneMap实战指南与常见问题解答

从航拍影像到三维地形:OpenDroneMap实战指南与常见问题解答 【免费下载链接】ODM A command line toolkit to generate maps, point clouds, 3D models and DEMs from drone, balloon or kite images. 📷 项目地址: https://gitcode.com/gh_mirrors/od…...

用 AI 生成视频?试试 Hailuo 视频生成 API!

在现代数字时代,视频内容的需求不断增长,而制作高质量视频的门槛也随之降低。今天,我想和大家分享一个强大的工具——Ace Data Cloud Hailuo 视频生成 API。这款 API 不仅支持文本转语音、多个声音切换和情感调整,还能为你提供清晰…...

3天刷完2026最新Java高频面试题(1000 道附答案解析)

2026年金三银四一半儿快要过去了,总结了上半年各类 Java 面试题,初中级和中高级都有,包括 Java 基础,JVM 知识面试题库,开源框架面试题库,操作系统面试题库,多线程面试题库,Tcp 面试…...

PP-DocLayoutV3快速调用:10行Python代码实现文档解析

PP-DocLayoutV3快速调用:10行Python代码实现文档解析 你是不是经常遇到一堆扫描的PDF或者图片文档,想快速提取里面的文字、表格和图片,却不知道从何下手?手动整理不仅费时费力,还容易出错。今天,我就来分享…...

逆向工程实战:从V8引擎角度破解JavaScript无限debugger(保姆级教程)

V8引擎深度解析:JavaScript调试机制与安全实践 在JavaScript开发领域,调试器(debugger)是开发者日常工作中不可或缺的工具。作为Chrome浏览器和Node.js的核心引擎,V8对debugger关键字的处理机制直接影响着开发者的调试体验。本文将深入探讨V8…...

3个技巧快速掌握LeagueAkari:英雄联盟智能辅助工具实战指南

3个技巧快速掌握LeagueAkari:英雄联盟智能辅助工具实战指南 【免费下载链接】League-Toolkit 兴趣使然的、简单易用的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 还在为BP阶…...

SAP-MM:公司间交易(STO)-跨公司销售

一、引言:当销售公司没有库存,怎么办? 假设这样一个场景:你所在的集团有两个法人实体——A 公司负责市场销售,与客户关系紧密,但本身不生产也不持有库存;B 公司是生产基地,拥有所有…...

langchain AI开发大模型翻译助手

我直接给你运行后的真实输出结果,并把为什么会这样输出讲得明明白白! 一、你的代码 最终输出结果 prompt: [SystemMessage(content你是一个翻译专家,擅长将 英文 语言翻译成 中文语言.), HumanMessage(contentI love Large Language Model.)] result: 我…...

LyricsX:让Mac音乐体验跃升的桌面歌词神器

LyricsX:让Mac音乐体验跃升的桌面歌词神器 【免费下载链接】Lyrics Swift-based iTunes plug-in to display lyrics on the desktop. 项目地址: https://gitcode.com/gh_mirrors/lyr/Lyrics 你是否也曾在Mac上听音乐时,因无法显示桌面歌词而感到遗…...

深度学习训练中loss震荡与不收敛的常见原因及实战调优策略

1. 为什么你的模型loss像过山车?先看懂这些典型症状 第一次打开TensorBoard看到自己的loss曲线像心电图一样上蹿下跳,那种感觉就像新手司机开车时方向盘失控。其实loss震荡和不收敛是深度学习中再常见不过的问题,但不同表现背后藏着完全不同的…...

导师推荐!盘点2026年最受欢迎的AI论文工具

一天写完毕业论文在2026年已不再是天方夜谭。2026年AI论文工具全面升级,实测提速超50%,覆盖选题、文献分析、内容生成、降重润色、格式排版等全流程场景,真正帮你高效搞定论文。 一、全流程王者:一站式搞定论文全链路(…...

华为eNSP实战:三层交换机互连配置全流程(附常见错误排查)

华为eNSP实战:三层交换机互连配置全流程(附常见错误排查) 在企业网络架构中,三层交换机扮演着至关重要的角色,它不仅能实现二层交换功能,还能进行三层路由转发。华为eNSP作为一款优秀的网络仿真平台&#x…...

YOLOE新手教程:如何用一行代码加载预训练模型

YOLOE新手教程:如何用一行代码加载预训练模型 1. 引言:为什么选择YOLOE? 在计算机视觉领域,目标检测一直是核心任务之一。传统检测模型需要预先定义好所有可能的类别,遇到新物体时往往束手无策。YOLOE(Yo…...

动态规划专练:力扣第509、70、746题

由于对动态规划DP算法 掌握得不是很好,所以决定进行动态规划专项训练。动态规划五部曲①确定dp[i]含义②递推公式③dp数组如何初始化④遍历顺序⑤打印dp数组(debug)除了第五条在力扣上不开会员无法实现外,其余四项就是做出dp类型题…...

UE4网络同步实战:AIController与RPC的避坑指南(含C++代码示例)

UE4网络同步实战:AIController与RPC的避坑指南(含C代码示例) 在多人联机游戏的开发中,网络同步始终是开发者面临的核心挑战之一。虚幻引擎4(UE4)提供了强大的网络框架,但其中AIController的服务…...

百度后端开发(Java)面试题精选:10道高频考题+答案解析

百度简介 百度是中国领先的互联网公司,以搜索引擎起家,现已发展成为涵盖人工智能、云计算、自动驾驶等多个领域的科技巨头。百度技术栈以Java为主,Spring生态为核心,在分布式系统、大数据处理、AI工程化方面有深厚积累。面试风格注重基础原理与工程实践结合,常考JVM调优、…...

10BASE-T1S PLCA参数配置避坑指南:从Node ID重复到Burst Timer设置,这些坑你踩过几个?

10BASE-T1S PLCA参数配置避坑指南:从Node ID重复到Burst Timer设置,这些坑你踩过几个? 在车载以太网的实际部署中,10BASE-T1S因其单对线缆实现多节点通信的特性,正逐渐成为智能座舱和传感器网络的热门选择。但当我们真…...

Z-Image-Turbo-rinaiqiao-huiyewunv 复杂场景生成挑战赛获奖作品赏析

Z-Image-Turbo-rinaiqiao-huiyewunv 复杂场景生成挑战赛获奖作品赏析 最近,我花了不少时间研究社区里的一场AI图像生成挑战赛,主题是“复杂场景生成”。参赛者们用的是一个叫Z-Image-Turbo-rinaiqiao-huiyewunv的模型,名字有点长&#xff0c…...

手把手教你用STM32CubeMX配置LCD1602显示:HAL库驱动移植+Proteus 8.12仿真

STM32CubeMX与Proteus联合开发:LCD1602显示实战指南 在嵌入式开发领域,STM32CubeMX和Proteus的组合为开发者提供了从硬件配置到软件仿真的完整解决方案。本文将深入探讨如何利用这两个工具链实现LCD1602液晶显示屏的驱动与显示功能,特别针对从…...

5G NR物理层实战:如何利用TS 38.211优化无线资源管理

5G NR物理层实战:TS 38.211无线资源管理优化指南 在5G网络部署的深水区,无线资源管理(RRM)的精细化程度直接决定了网络性能天花板。作为3GPP物理层协议集的核心文档,TS 38.211规范中隐藏着诸多未被充分挖掘的优化密钥—…...

如何用League-Toolkit实现英雄联盟游戏自动化:3个核心模块深度解析

如何用League-Toolkit实现英雄联盟游戏自动化:3个核心模块深度解析 【免费下载链接】League-Toolkit 兴趣使然的、简单易用的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit Le…...

Revolut警告支持高耗能AI和加密货币业务可能面临声誉风险

英国银行应用Revolut表示,由于支持加密货币和AI等高耗能行业,公司可能面临声誉风险,同时该公司公布去年利润增长57%。这家金融科技公司在等待监管批准五年后,现在终于可以作为正式的英国银行启动业务。Revolut在其2025年年报中警告…...

终极免费逆向神器Ghidra:3分钟极速安装与新手入门指南

终极免费逆向神器Ghidra:3分钟极速安装与新手入门指南 【免费下载链接】ghidra_installer Helper scripts to set up OpenJDK 11 and scale Ghidra for 4K on Ubuntu 18.04 / 18.10 项目地址: https://gitcode.com/gh_mirrors/gh/ghidra_installer 还在为复杂…...

计算机毕业设计springboot研友帮系统设计与实现 基于SpringBoot的考研互助社区平台开发与实现 SpringBoot框架下研究生学术协作系统的设计与应用

计算机毕业设计springboot研友帮系统设计与实现w2zpm5oh (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。 随着研究生招生规模的持续扩大,考研竞争日益激烈&#xff0…...

【实战指南】Spirent TCL 并发与新建连接测试全流程解析

1. Spirent TCL测试基础与环境搭建 第一次接触Spirent TestCenter时,我也被它强大的功能和复杂的界面吓到过。但实际用下来发现,只要掌握几个核心模块,就能完成大多数性能测试任务。这里先带大家快速搭建测试环境,为后续的并发和新…...

解决Windows端口转发难题:PortProxyGUI的可视化管理方案

解决Windows端口转发难题:PortProxyGUI的可视化管理方案 【免费下载链接】PortProxyGUI A manager of netsh interface portproxy which is to evaluate TCP/IP port redirect on windows. 项目地址: https://gitcode.com/gh_mirrors/po/PortProxyGUI 在网络…...

重塑前端图片处理流程:compressorjs的高效压缩技术突破之路

重塑前端图片处理流程:compressorjs的高效压缩技术突破之路 【免费下载链接】compressorjs compressorjs: 是一个JavaScript图像压缩库,使用浏览器原生的canvas.toBlob API进行图像压缩。 项目地址: https://gitcode.com/gh_mirrors/co/compressorjs …...