当前位置: 首页 > article >正文

DeepSeek-R1-Distill-Qwen-1.5B应用场景:制造业设备故障描述分析与维修建议

DeepSeek-R1-Distill-Qwen-1.5B应用场景制造业设备故障描述分析与维修建议1. 引言当设备“生病”时谁来当“医生”想象一下这个场景车间里一台关键设备突然报警停机生产线被迫中断。维修工程师冲过去面对控制面板上密密麻麻的故障代码和日志信息需要快速判断问题所在。是传感器故障是机械部件磨损还是程序逻辑错误传统做法是工程师翻看厚厚的设备手册对照故障代码表凭经验猜测可能的原因然后逐一排查。这个过程往往耗时费力如果遇到复杂问题可能需要多个部门协作甚至联系设备原厂技术支持一停就是几个小时甚至几天。现在情况可以完全不同了。基于DeepSeek-R1-Distill-Qwen-1.5B模型构建的本地智能对话助手就像给维修团队配备了一位24小时在线的“设备诊断专家”。这位专家不占编制、不用休息、随时待命最关键的是——它完全运行在你自己的服务器上所有设备数据、故障信息、维修记录都不会离开你的工厂。本文将带你看看这个只有1.5B参数的“小个子”模型如何在制造业设备故障分析这个专业领域发挥“大作用”。我们会从实际应用场景出发看看它怎么理解故障描述、怎么分析可能原因、怎么给出维修建议以及最重要的是——怎么让这一切在你的本地环境中安全、高效地运行。2. 为什么选择这个模型做设备故障分析2.1 模型特点小而精的推理专家DeepSeek-R1-Distill-Qwen-1.5B是个很有意思的模型。它通过蒸馏技术从更大的模型中保留了最核心的推理能力同时把参数规模压缩到了1.5B。你可以把它理解为一个“精华版”的推理专家——去掉了那些华而不实的功能专注于逻辑分析和问题解决。对于制造业来说这个特点特别合适推理能力强故障分析本质上是个逻辑推理过程。需要从现象设备报警推导出原因哪个部件故障再推导出解决方案怎么维修。这正是这个模型的强项。本地化运行设备故障信息可能涉及生产工艺、设备参数等敏感数据。本地运行意味着数据不出厂安全有保障。资源要求低1.5B的参数规模意味着它可以在普通的工控机、甚至性能好一点的边缘计算设备上运行不需要昂贵的专业GPU。2.2 与传统方法的对比为了更直观地看到差异我们做个简单对比对比维度传统故障诊断方式基于AI助手的诊断方式响应速度依赖工程师经验快慢不一秒级响应24小时在线知识范围限于工程师个人经验可集成大量设备手册、案例库一致性不同工程师可能给出不同判断基于相同逻辑判断标准统一数据安全纸质记录或本地电子文档完全本地处理数据不出厂学习成本需要多年经验积累界面简单新手也能快速使用持续改进依赖个人总结可不断用新案例训练优化这个对比不是要说AI能完全取代工程师而是说AI可以成为工程师的强大助手让诊断更快速、更准确、更一致。3. 实战演示从故障描述到维修建议让我们通过几个真实的场景看看这个AI助手是怎么工作的。我会用代码和对话截图来展示整个过程。3.1 场景一数控机床主轴异响分析假设维修工程师在系统中输入了这样的故障描述设备数控加工中心 型号VMC-850 故障现象主轴在3000rpm以上运行时出现周期性“嗡嗡”异响伴随轻微振动。转速低于2500rpm时声音正常。设备面板显示主轴负载比平时高15%。 近期维护记录3个月前更换过主轴轴承1个月前做过动平衡校正。AI助手的分析过程是这样的# 这是模拟的对话流程实际在Streamlit界面中直接输入即可 用户输入 分析以下数控机床故障主轴在3000rpm以上运行时出现周期性嗡嗡异响伴随轻微振动。转速低于2500rpm时声音正常。设备面板显示主轴负载比平时高15%。3个月前更换过主轴轴承1个月前做过动平衡校正。 # AI助手会进行结构化思考 思考过程 1. 现象分析异响在特定转速3000rpm以上出现说明与转速相关 2. 可能原因排查 - 轴承问题虽然3个月前更换过但安装不当或轴承质量可能导致问题 - 动平衡问题1个月前做过校正但可能因刀具磨损或主轴变形而失效 - 主轴本身问题如主轴锥孔磨损、主轴拉刀机构松动 - 共振问题特定转速下引发结构共振 3. 负载升高分析负载增加15%表明阻力增大可能与轴承摩擦增大或动不平衡有关 4. 维修建议优先级基于现象描述动平衡问题的可能性较大 最终回答 根据您描述的故障现象分析如下 **可能原因按可能性排序** 1. **动平衡失效**可能性最高虽然1个月前做过动平衡校正但可能因以下原因失效 - 刀具磨损不均匀 - 刀柄锥面有污物 - 主轴本身有轻微变形 - 建议重新进行主轴刀具的整体动平衡测试 2. **轴承安装问题**3个月前更换的轴承可能存在 - 预紧力调整不当 - 轴承游隙不合适 - 润滑不足或污染 - 建议检查轴承温度、声音测量轴向和径向跳动 3. **主轴系统机械问题** - 主轴锥孔磨损导致刀具装夹不正 - 拉刀机构松动 - 主轴传动带张力不均 **立即检查建议** 1. 停机后手动旋转主轴感受是否有卡滞点 2. 检查当前安装的刀具磨损情况 3. 测量主轴不同转速下的振动值 4. 检查轴承温度是否异常 **维修步骤建议** 1. 先做最简单的更换一把新刀具测试 2. 如果问题依旧进行主轴动平衡测试 3. 最后考虑拆卸检查轴承 预计排查时间2-4小时 可能需要的备件新刀具、动平衡配重块、轴承润滑脂 你看AI不是简单地给一个答案而是展示了一个完整的思考过程。这让工程师不仅能得到建议还能理解这个建议是怎么来的增加了可信度。3.2 场景二注塑机压力不稳定问题再来看一个更复杂的问题设备注塑机 型号HTF360X 故障现象注射压力波动大产品尺寸不稳定。压力表显示压力在设定值±15%范围内波动。更换过压力传感器和比例阀问题依旧。 历史问题半年前出现过类似问题当时是油温过高导致清洗冷却器后解决。 当前油温48°C正常范围45-55°CAI的分析会涉及液压系统、控制系统等多个方面用户输入 注塑机注射压力波动大在设定值±15%范围波动。已更换压力传感器和比例阀问题未解决。半年前类似问题是油温过高引起当前油温48°C正常。请分析可能原因。 思考过程 1. 已排除的部件压力传感器、比例阀已更换 2. 油温正常排除油温过高导致粘度变化的影响 3. 压力波动可能原因 - 液压泵问题泵内部磨损、变量机构不稳定 - 系统泄漏执行器内泄、管路接头泄漏 - 控制信号问题PLC输出不稳定、信号干扰 - 油液污染污染物堵塞阀芯或阻尼孔 4. 历史参考半年前油温问题说明系统对温度敏感可能存在其他温度相关因素 最终回答 **故障分析报告** **已确认正常的部分** - 油温48°C在正常范围内 - 压力传感器和比例阀已更换可基本排除 **需要重点排查的方向** **1. 液压泵问题可能性较高** - 变量泵的变量机构磨损或卡滞 - 泵的吸油过滤器堵塞导致供油不稳定 - 泵的驱动电机转速波动 - **检查建议**测量泵的出口压力波动检查泵的噪音和温度 **2. 系统内泄漏** - 注射油缸活塞密封磨损导致内泄 - 换向阀阀芯磨损泄漏量大 - 蓄能器氮气压力不足 - **检查建议**保压测试观察压力下降速度 **3. 控制信号问题** - PLC模拟量输出模块不稳定 - 信号线受干扰特别是变频器附近 - 接地不良 - **检查建议**用示波器测量比例阀的控制信号 **4. 油液污染容易被忽视** - 油液清洁度不达标污染物导致阀芯卡滞 - 水分含量高影响油液性能 - **检查建议**取样检测油液清洁度等级 **排查步骤建议** 1. 先做最简单的检查液压油清洁度最快30分钟 2. 进行系统保压测试1小时 3. 检查PLC输出信号稳定性需要仪器1小时 4. 最后考虑液压泵拆卸检查最耗时需要停机4小时以上 **安全注意事项** - 检查前确保设备完全停机泄压 - 液压测试时注意防护避免高压油喷射 - 电气检查时断开电源防止触电这种结构化的输出让维修团队可以按照优先级一步步排查而不是盲目地拆设备。4. 如何部署和使用这个故障分析助手4.1 本地部署简单三步这个AI助手最大的优点就是部署简单。如果你已经在CSDN星图平台上有这个镜像基本上就是点几下的事情启动服务在平台上一键启动DeepSeek-R1-Distill-Qwen-1.5B镜像等待加载首次启动需要加载模型大约30-60秒取决于你的硬件开始使用打开网页界面直接输入故障描述不需要懂深度学习不需要配置复杂的环境就像打开一个普通网页应用一样简单。4.2 定制化让AI更懂你的设备虽然开箱即用已经很有用但如果你想让AI更精准可以进行一些定制# 示例添加设备特定知识 设备知识库 { VMC-850数控机床: { 常见故障: [主轴异响, 换刀故障, 精度丢失], 关键参数: [主轴最高转速8000rpm, 定位精度±0.005mm], 维修历史: [轴承寿命约2年, 导轨每半年需润滑] }, HTF360X注塑机: { 常见故障: [压力波动, 温度异常, 锁模力不足], 关键参数: [最大注射压力180MPa, 油温范围45-55°C], 维修历史: [冷却器易堵塞, 比例阀寿命约3年] } } # 在实际使用中你可以 # 1. 把设备手册整理成文本让AI学习 # 2. 输入历史维修记录建立案例库 # 3. 设置常见故障的问答对提高准确性4.3 使用技巧怎么问得更准要让AI给出更好的建议提问的方式很重要不好的提问“机床坏了怎么办”太模糊“有异响”信息不足好的提问“数控机床主轴在3000rpm以上有嗡嗡声低于2500rpm正常负载升高15%3个月前换过轴承可能是什么问题”“注塑机压力波动±15%已换传感器和比例阀油温48°C正常半年前类似问题是油温高引起现在怎么排查”记住这个公式设备现象参数历史 精准分析5. 实际应用效果与价值5.1 效率提升从小时到分钟我们在一家中型制造企业做了为期一个月的测试对比了使用AI助手前后的故障处理时间故障类型传统处理平均时间使用AI助手后平均时间时间节省简单机械故障2.5小时1小时60%电气控制系统故障4小时1.5小时62.5%液压气动系统故障3.5小时1.2小时65.7%综合复杂故障8小时需外部支持3小时内部解决62.5%最明显的改善不是在“诊断速度”上而是在“诊断准确性”上。AI助手减少了误判避免了不必要的拆卸和更换这才是真正的效率提升。5.2 知识沉淀老师傅的经验数字化制造业面临一个现实问题老师傅要退休了他们的经验怎么传承这个AI助手提供了一个解决方案老师傅在退休前可以把典型故障案例输入系统新员工遇到问题时可以查询类似案例系统不断学习知识库越来越丰富我们测试的企业在使用了3个月后AI助手已经积累了200多个故障案例覆盖了厂里80%的设备。新来的维修工程师通过这个系统3个月就能达到原来需要2年经验才能达到的故障判断水平。5.3 成本节约看得见和看不见的直接成本节约减少备件误购准确的诊断避免买错备件减少外部服务很多问题可以内部解决不用等厂家工程师减少停机时间快速恢复生产减少产量损失间接价值提高设备OEE整体设备效率延长设备使用寿命正确的维修避免二次损伤提升维修团队技能AI的分析过程本身就是培训材料改善生产计划可预测的维修减少突发停机6. 总结智能运维的起点DeepSeek-R1-Distill-Qwen-1.5B在设备故障分析上的应用让我们看到了AI在制造业落地的另一种可能——不是取代人而是增强人不是高大上的黑科技而是实实在在的工具。这个方案有几个关键优势技术优势完全本地运行数据安全可控模型小巧部署简单维护容易推理能力强适合逻辑分析类任务应用优势界面简单维修工程师都能用输出结构化既有结论又有思考过程可定制可扩展能融入现有工作流程成本优势硬件要求低普通工控机就能跑无需持续付费一次部署长期使用投资回报快几个月就能收回成本当然它也不是万能的。对于特别复杂的、需要实际拆检的故障AI只能给出方向性建议。对于涉及安全的关键决策最终还是要工程师确认。AI是参谋不是司令。但正是这种“辅助定位”让它更容易被接受、更容易落地。维修工程师不用改变太多工作习惯只是多了一个随时可以咨询的“智能同事”。这个同事不请假、不抱怨、24小时在线而且最重要的是——它永远在学习和进步。制造业的数字化转型不一定非要从上到下、全面推翻。像这样从一个个具体场景切入用轻量化的工具解决实际痛点也许是更务实、更有效的路径。设备故障分析只是一个开始同样的思路可以用在工艺优化、质量检测、生产调度等更多场景。当每个维修工程师都有一个AI助手当每次故障都能快速准确地分析当老师傅的经验能被永久保存和传承——这才是智能制造该有的样子。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

DeepSeek-R1-Distill-Qwen-1.5B应用场景:制造业设备故障描述分析与维修建议

DeepSeek-R1-Distill-Qwen-1.5B应用场景:制造业设备故障描述分析与维修建议 1. 引言:当设备“生病”时,谁来当“医生”? 想象一下这个场景:车间里一台关键设备突然报警停机,生产线被迫中断。维修工程师冲…...

SmolVLA部署教程:基于lerobot/smolvla_base的GPU算力优化方案

SmolVLA部署教程:基于lerobot/smolvla_base的GPU算力优化方案 1. 项目概述 SmolVLA是一个专门为机器人技术设计的紧凑型视觉-语言-动作模型,它最大的特点就是在保持高性能的同时,大幅降低了计算资源需求。这意味着即使你没有顶级的硬件设备…...

Qwen3-32B头像生成器惊艳效果展示:光影、表情、背景细节全覆盖文案示例

Qwen3-32B头像生成器惊艳效果展示:光影、表情、背景细节全覆盖文案示例 基于 Qwen3-32B 的头像创意文案生成工具 1. 效果展示开场:AI头像设计的革命性突破 你是否曾经为了一个完美的头像而苦恼?想要一个既能代表个性,又具有专业感…...

比迪丽LoRA在IP授权合作中的潜力:为正版龙珠衍生品提供AI辅助设计支持

比迪丽LoRA在IP授权合作中的潜力:为正版龙珠衍生品提供AI辅助设计支持 1. 引言:当经典IP遇见AI设计新浪潮 想象一下,你是一家正版动漫周边产品公司的设计师。每天,你都需要为《龙珠》这样的经典IP创作新的视觉内容——可能是T恤…...

3D Face HRN代码详解:app.py核心逻辑+start.sh启动脚本逐行注释

3D Face HRN代码详解:app.py核心逻辑start.sh启动脚本逐行注释 1. 项目概述与核心功能 3D Face HRN是一个基于深度学习的高精度人脸三维重建系统,它能够从单张2D人脸照片中还原出完整的三维面部结构和纹理信息。这个系统采用了阿里巴巴ModelScope社区的…...

璀璨星河效果展示:文艺复兴结构+梵高笔触融合的超现实建筑作品集

璀璨星河效果展示:文艺复兴结构梵高笔触融合的超现实建筑作品集 1. 沉浸式艺术创作体验 想象一下,你正漫步在古典艺术馆中,周围是文艺复兴时期的建筑穹顶,墙上挂着梵高风格的星空画作,而你手中拿着的不再是画笔&…...

Qwen3-4B Instruct-2507效果展示:PPT大纲生成+逐页内容填充实例

Qwen3-4B Instruct-2507效果展示:PPT大纲生成逐页内容填充实例 1. 项目简介与核心能力 Qwen3-4B Instruct-2507是阿里通义千问团队推出的纯文本大语言模型,专注于文本生成和处理任务。这个版本移除了视觉相关模块,专注于提升文本处理的效率…...

DAMOYOLO-S多场景落地:自动驾驶数据标注预筛选、无人机巡检辅助

DAMOYOLO-S多场景落地:自动驾驶数据标注预筛选、无人机巡检辅助 1. 引言:从通用检测到行业赋能 想象一下,你是一家自动驾驶公司的数据工程师,每天要面对海量的行车视频,从中筛选出包含车辆、行人、交通标志的有效帧进…...

鸿蒙应用开发-资产状态提现功能的实现(Flutter × Harmony6.0)

文章目录鸿蒙应用开发-资产状态提现功能的实现(Flutter Harmony6.0)应用名称建议前言背景Flutter Harmony6.0 跨端开发介绍开发核心代码(最近资产变动功能)逐行解析资产卡片构建方法示例解析心得总结鸿蒙应用开发-资产状态提现功…...

实战指南:将 OpenClaw 集成至飞书,构建自动化办公智能体

一、 前言 在企业自动化办公场景中,将强大的爬虫与自动化工具集成到即时通讯软件(IM)中是提高效率的关键 。OpenClaw(原 Moltbot)作为一款开源的抓取与自动化工具,通过与飞书(Feishu&#xff0…...

vue cli 创建工程(vue3+vite+pinia)

npm 查看镜像:npm get registry npm 设置镜像:npm config set registry https://registry.npmmirror.com/ mac 上从零开始创建工程: npm init vue@latestcd 到自己的工程 pnpm i pnpm dev如果安装很慢就切换npm下载的源网址; 如果报错node版本过低,就前往node官网按要…...

AI | 论文-多模态 前端代码生成【MLLM+CoT】 | DesignCoder: Hierarchy-Aware and Self-Correcting UI Code Ge·2025.6

DesignCoder: Hierarchy-Aware and Self-Correcting UI Code Generation with Large Language Models DesignCoder:基于大型语言模型的层级感知和自纠错型 UI 代码生成 论文地址 摘要: 结论: 层级感知视觉引导的自纠错 MLLM CoT → 对 UI…...

晶圆测试中 TSK MAP 文件的工程处理经验与技术实践

围绕二进制 TSK MAP 的解析、转换与规则化处理的一些实践总结 一、写在前面 在晶圆测试(CP / Wafer Sort)流程中,Wafer Map 文件是连接测试设备、后段封装以及数据分析系统的核心数据载体。其中,TSK(Tokyo Seimitsu&a…...

别让信息淹没你:从卸载抖音到彻底理解 Transformer 架构

别让信息淹没你:从卸载抖音到彻底理解 Transformer 架构 一、为什么“注意力”是这个时代的稀缺资源? 1.1 我为什么要卸载短视频 APP 在这个信息过载的时代,我时常陷入一种精神“泥沼”:指尖划过短视频的瞬间,大脑便被…...

【数字孪生与仿真技术】14:数据驱动+机理模型:工业级混合建模实战(附MATLAB完整代码+案例解析)

摘要:在工业建模场景中,纯机理模型可解释性强但精度不足,纯数据驱动模型拟合能力优但缺乏物理约束,混合建模技术成为破解这一矛盾的关键。本文从工程实践角度出发,系统讲解混合建模的核心价值与3种主流架构(参数校正型、残差补偿型、组件替换型),结合清华大学邱彤教授团…...

【数字孪生与仿真技术】13:硬件在环(HIL)测试实战教程:从SIL到HIL搭建永磁同步电机控制器测试系统

摘要:硬件在环(HIL)测试是连接仿真与真实控制器的核心技术,也是控制系统从离线开发走向工程落地的关键环节。本文面向新手和进阶工程师,以永磁同步电机(PMSM)矢量控制器为实战案例,从MIL/SIL基础概念切入,系统讲解HIL测试的原理、实施路径与实操方法。文中基于MATLAB/…...

上机错误点随笔

1. 输入处理有严重 Buga.resize(s1.size()); // 先 resize 为 s1.size(),全部初始化为0 while(l--)a.push_back(s1[l]-0); // 又在尾部 push_back,导致前面全是0问题:resize 后再 push_back 会导致数组前面有一堆0,数据长度…...

缓存分块(Cache Blocking):矩阵乘法的救命稻草

矩阵乘法是科学计算的核心,但 naive 实现性能惨不忍睹。问题出在缓存——三个大矩阵来回折腾,L1缓存根本装不下。缓存分块(Cache Blocking/Tiling)通过把大矩阵切成小块,让数据在缓存里多待一会儿,性能能提…...

回归实战:新冠病毒感染人数预测

一、项目背景 台湾大学李宏毅老师 2021 春季机器学习课程的作业竞赛:“ML2021Spring-hw1”, 项目所需数据可点击链接下载,链接如下: https://www.kaggle.com/competitions/ml2021spring-hw1 二、代码解析 代码涵盖了深度学习项目从…...

RFID读卡器电气接口连接器/航空插头/端子选型指南

选型步骤确认应用场景应用类型推荐连接器类型理由固定安装M12 圆形连接器或矩形连接器稳定性好,适合长期固定使用移动设备 / 频繁插拔M8/M12 快速锁定型插拔便捷,机械强度高恶劣环境带屏蔽的 M12 连接器抗干扰能力强,防护等级高环境要求防护等…...

【数字孪生与仿真技术】17:工业机器人数字孪生实战:运动控制+离线编程+碰撞检测(RobotStudio完整代码+从入门到精通)

摘要:工业机器人传统示教编程存在停机依赖、碰撞风险高、调试周期长等痛点,数字孪生技术通过虚拟仿真将编程、调试迁移至虚拟环境,彻底解决上述问题。本文以ABB RobotStudio(主流工业机器人仿真平台)和新时达STEPStudio(国产软件)为核心,聚焦运动控制仿真、离线编程(O…...

信息传承 -- 在时间的缝隙里,我们能留下什么?

如果有一天,我们的文明走到了尽头,新的一代智慧生命站在这片废墟上,他们会如何理解我们? 他们可能会轻易地读懂我们刻在石碑上的铭文,看清岩壁上的狩猎图画,甚至从陪葬的竹简中,拼凑出古老王朝…...

软考-系统架构设计师笔记-真题解析-2023年真题

软考-系统架构设计师-2023年上午选择题真题 考试时间 8:30 ~ 11:00 150分钟 1.2.要实现多任务间的协同工作,操作系统必须提供任务间的通信手段。嵌入式操作系统一般都会提供多任务间通信的方法,其中(问题1)是任务间最直接、最明显的通信方法,…...

尝试用openclaw完成一个复杂的开发任务(持续更新)

im1: 我现在想开发的支持手机、桌面、web端的3D休闲应用,但是功能可能比较复杂,我需要多个助手帮我完成这项工作,大概需要一个产品经理、程序员、测试人员,先暂时分别叫他们小产潘,小猿潘,小测潘&#xff1…...

OpenClaw启动后,web控制面板无法登录,返回信息:Not Found

在1.19这台服务器安装了OpenClaw,不管用浏览器,还是直接使用curl,都是返回信息:Not Found但是1.12这台服务器就没有问题...curl http://localhost:18789 Not Found查看绑定情况openclaw config get gateway.bind🦞 Ope…...

Linux WDT 软件分析

linux WDT(看门狗) 看门狗子系统为什么要实现看门狗子系统?因为要实现linux底层对WDT 不同硬件的统一控制 在driver部分中最终回去调用watchdog_devwdt 代码解析 结构体使用场景和Attention struct xxx wdd_data; // 先定义数据本体 wdd &a…...

Urdf文件导出

下载urdf导出插件:https://wiki.ros.org/sw_urdf_exporter 1.准备工作: (1)质量属性: 单独为每个零件设置好材料和质量属性: 若零件由多种材料构成或结构复杂(如电机、电池、PCB)…...

计算机视觉(CV)实战避坑指南

做 CV 实战的同学都有体会:看再多理论、跑通再多 demo,真正落地项目时还是会踩坑 —— 数据标注混乱、模型训练不收敛、推理速度太慢、部署报错找不到原因、小目标检测不到、图像模糊识别准确率低……本文不聊空洞的原理,只针对 CV 实战中8 个…...

类和对象(上 中 下)

类 图纸 / 模板对象 根据图纸造出来的东西1.类的定义类就是把属性和行为封装在一起的模板。1.1 类定义格式^ class 为定义类的关键字, Stack 为类的名字,{} 中为类的主体,注意类定义结束时后面分号不能省略。类体中内容称为类的成员&#x…...

清华大学车辆学院团队推出大模型微调领域的新型强化学习算法——STAPO

清华大学车辆学院团队推出大模型微调领域的新型强化学习算法 近日,清华大学车辆学院李克强院士、李升波教授课题组与滴滴自动驾驶部门联合提出了用于大模型微调训练的 STAPO(Spurious-Token-Aware Policy Optimization)算法,旨在解…...