当前位置: 首页 > article >正文

智能体 Harness Engineering (驾驭工程) 架构设计剖析

大家好我是玄姐。PSOpenClaw 之后Harness Engineering 到底是什么在企业如何落地有哪些使用场景具体的实践经验是什么今晚开场直播详细讲解欢迎点击预约直播见。摘要智能体 模型 驾驭层Harness。驾驭层工程Harness Engineering是我们围绕模型构建系统、将其转变为工作引擎的过程。模型包含智能而驾驭层让这份智能变得可用。本文定义了什么是驾驭层并推导了当今和未来智能体所需的核心架构组件。一、谁能给驾驭层Harness下个定义智能体 模型 驾驭层如果你不是模型你就是驾驭层。驾驭层是除模型本身之外的所有代码、配置和执行逻辑。一个原始模型不是智能体。但当驾驭层赋予它状态、工具执行、反馈循环和可强制执行的限制时它就成为了智能体。具体而言驾驭层包括系统提示词System Prompts工具、Skills、MCP 及其描述配套基础设施文件系统、沙盒、浏览器编排逻辑子智能体生成、交接、模型路由用于确定性执行的钩子/中间件压缩、续接、代码检查在模型和驾驭层之间划分智能体系统的边界有许多混乱的方式。但在我看来这是最清晰的定义因为它迫使我们思考如何围绕模型智能来设计系统。本文的其余部分将介绍驾驭层的核心架构组件并从模型的最基本原语出发推导为什么需要每个架构组件。二、为什么我们需要驾驭层……从模型的视角来看有些事情我们希望智能体去做但模型开箱即用是做不到的。这就是驾驭层发挥作用的地方。模型主要接收文本、图像、音频、视频等数据然后输出文本。仅此而已。开箱即用它们无法在多次交互之间维持持久状态执行代码访问实时知识设置环境并安装软件包以完成工作这些都是驾驭层级别的功能。LLM 的结构要求必须有某种机制将其包裹起来才能完成有用的工作。例如要实现聊天这样的产品体验我们需要将模型包裹在一个 while 循环中以跟踪先前的消息并追加新的用户消息。阅读本文的每个人都用过这种驾驭层。核心思想是我们将期望的智能体行为转化为驾驭层中的实际功能。三、从期望的智能体行为逆向推导驾驭层工程驾驭层工程帮助人类注入有用的先验知识来引导智能体行为。随着模型能力越来越强驾驭层被用来精确地扩展和纠正模型以完成以前不可能完成的任务。我们不会列出驾驭层功能的详尽清单。目标是从帮助模型完成有用工作的起点出发推导出一套功能。我们将遵循这样的模式我们想要的或想要修复的行为 → 帮助模型实现这一目标的驾驭层设计3.1 文件系统持久化存储与上下文管理我们期望的行为智能体拥有持久化存储以便与真实数据交互、卸载无法放入上下文的信息并跨会话保持工作成果。模型只能直接在其上下文窗口内操作知识。在文件系统出现之前用户必须直接复制/粘贴内容给模型这种用户体验很笨拙而且对自主智能体行不通。世界早已在使用文件系统完成工作因此模型自然在数十亿 tokens 的训练数据中学习到了如何使用它们。自然的解决方案变成了驾驭层配备文件系统抽象和文件操作工具。文件系统可以说是最基础的驾驭层原语因为它解锁了以下能力工作空间智能体可以读取数据、代码和文档。增量工作工作可以逐步添加和卸载而不是全部保存在上下文中。智能体可以存储中间输出并维持超出单次会话的状态。协作表面文件系统是自然的协作界面。多个智能体和人类可以通过共享文件进行协调。像智能体团队Agent Teams这样的架构依赖于此。版本控制Git 为文件系统增加了版本管理使智能体能够跟踪工作、回滚错误和分支实验。我们将在下文再次提到文件系统因为它实际上是其他所需功能的关键驾驭层原语。3.2 Bash 代码通用工具我们期望的行为智能体能够自主解决问题无需人类预先设计每一个工具。今天的主流的智能体执行模式是 ReAct 循环模型推理、通过工具调用采取行动、观察结果、重复循环。但驾驭层只能执行它们拥有逻辑的工具。与其强迫用户为每一个可能的动作都构建工具不如给智能体一个通用工具如 Bash。驾驭层配备 Bash 工具让模型通过编写和执行代码自主解决问题。Bash 代码执行是向模型提供一台计算机并让它自主解决其余问题的重要一步。模型可以通过代码即时设计自己的工具而不是受限于固定的预配置工具集。驾驭层仍然配备其他工具但代码执行已成为自主问题解决的默认通用策略。3.3 沙盒与工具执行与验证工作我们期望的行为智能体需要具备正确默认配置的环境以便安全地行动、观察结果并取得进展。我们已经赋予模型存储能力和执行代码的能力但所有这些都需要在某个地方发生。在本地运行智能体生成的代码是危险的而且单一的本地环境无法扩展到大规模智能体工作负载。沙盒Sandboxes为智能体提供了安全的操作环境。驾驭层不再在本地执行而是可以连接到沙盒来运行代码、检查文件、安装依赖并完成任务。这创造了代码的安全、隔离执行。为了更高的安全性驾驭层可以设置命令白名单并强制网络隔离。沙盒还解锁了规模化能力因为环境可以按需创建、分散到众多任务中并在工作完成后销毁。良好的环境配备良好的默认工具。驾驭层负责配置工具使智能体能够完成有用的工作。这包括预装语言运行时和软件包、Git 和测试用的 CLI、用于网页交互和验证的浏览器。浏览器、日志、截图和测试运行器等工具赋予智能体观察和评估其工作的方式。这帮助它们创建自我验证循环编写应用代码、运行测试、检查日志、修复错误。模型开箱即用不会配置自己的执行环境。决定智能体在哪里运行、有哪些工具可用、能访问什么、如何验证其工作这些都是驾驭层级别的设计决策。3.4 记忆与搜索持续学习我们期望的行为智能体应该记住它们见过的东西并能访问在它们训练时还不存在的信息。模型除了权重和当前上下文中的内容外没有额外的知识。在不修改模型权重的情况下增加知识的唯一方式是通过上下文注入。对于记忆文件系统再次成为核心原语。驾驭层支持 AGENTS.md 等记忆文件标准这些文件在智能体启动时被注入上下文。随着智能体添加和编辑此文件驾驭层将更新后的文件加载到上下文中。这是一种持续学习的形式智能体在一个会话中持久存储知识并在未来会话中注入这些知识。知识截止日期意味着模型无法直接访问新数据比如更新的库版本除非用户直接提供。为了获取最新知识网页搜索和 Context7 等 MCP 工具帮助模型访问超出知识截止日期的信息比如新的库版本或训练停止后才出现的当前数据。网页搜索和用于查询最新上下文的工具是驾驭层中值得内置的有用原语。3.5 对抗上下文退化Context Rot我们期望的行为智能体性能不应随着工作进展而下降。上下文退化Context Rot描述了模型随着上下文窗口填满在推理和完成任务方面变得更差的现象。上下文是宝贵且稀缺的资源因此驾驭层需要策略来管理它。今天的驾驭层很大程度上是优秀上下文工程的交付机制。压缩Compaction解决了当上下文窗口接近填满时该怎么办的问题。没有压缩时当对话超出上下文窗口会发生什么一种选择是 API 报错这不太好。驾驭层必须对这种情况使用某种策略。因此压缩智能地卸载和总结现有上下文窗口让智能体能够继续工作。工具调用卸载Tool call offloading有助于减少大型工具输出的影响这些输出可能会嘈杂地混乱上下文窗口却不提供有用信息。驾驭层保留超过阈值 tokens 数的工具输出的头部和尾部并将完整输出卸载到文件系统以便模型在需要时可以访问。技能Skills解决了在智能体启动时将过多工具或 MCP 服务器加载到上下文中导致性能下降的问题在智能体开始工作前就退化性能。技能是一种驾驭层级别的原语通过渐进式披露progressive disclosure解决这个问题。模型并没有选择在启动时将技能前言加载到上下文中但驾驭层可以支持这一点以保护模型免受上下文退化的影响。3.6 长时程自主执行我们期望的行为我们希望智能体能够在长时程内自主、正确地完成复杂工作。自主软件创建是编程智能体的圣杯。但今天的模型存在提前停止early stopping、复杂问题分解困难以及跨多个上下文窗口工作时的不连贯性等问题。优秀的驾驭层必须围绕所有这些进行设计。这就是前面的驾驭层原语开始产生复合效应的地方。长时程工作需要持久状态、规划、观察和验证以便在多个上下文窗口中持续工作。文件系统和 Git用于跨会话跟踪工作。智能体在长任务中产生数百万 tokens因此文件系统持久地捕获工作以便随时间跟踪进度。添加 Git 允许新智能体快速了解项目的最新工作和历史。对于多个智能体一起工作文件系统也充当工作的共享账本智能体可以在此协作。Ralph 循环Ralph Loops用于继续工作。Ralph 循环是一种驾驭层模式它通过钩子拦截模型的退出尝试并在干净的上下文窗口中重新注入原始提示强制智能体针对完成目标继续其工作。文件系统使这成为可能因为每次迭代都以全新的上下文开始但会读取前一次迭代的状态。规划与自我验证用于保持正轨。规划是模型将目标分解为一系列步骤的过程。驾驭层通过优秀的提示工程和在文件系统中注入如何使用计划文件的提醒来支持这一点。在完成每一步后智能体通过自我验证来检查其工作的正确性从而受益。驾驭层中的钩子可以运行预定义的测试套件并在失败时带着错误消息循环回到模型或者可以提示模型独立评估其代码。验证将解决方案建立在测试中并创建自我改进的反馈信号。四、驾驭层的未来4.1 模型训练与驾驭层设计的耦合现在的 AI 编程助手比如 Claude Code 和 OpenAI 的 Codex它们的训练方式跟以前不一样了。以前的训练就像让学生只看教科书学开车看遍所有驾驶手册但从来没摸过方向盘。它们记住了知识但不知道怎么实际操作。现在的训练后训练则是直接给学员一辆真车有方向盘、有刹车、有导航系统。模型就在这个真实的驾驭层环境里学习怎么打方向、怎么变道、怎么用 GPS。它们一边学理论一边在真实工具上练习。这带来一个有趣的现象模型和它使用的工具在互相磨合中成长。工具越用越顺手是因为专门练过想象一下这个循环开发者发现给模型配一个文件阅读器工具特别好用。于是把这个工具加入驾驭层然后用这套配置去训练新版本的模型。新模型在大量练习中变得越来越擅长使用这个文件阅读器知道什么时候该读文件、怎么快速找到关键内容。模型变强了开发者又发现代码编辑器工具也很实用再加入驾驭层再拿去训练下一代模型。结果就是模型不是学会了通用的工具使用能力而是变成了这套特定工具的熟练工。就像一个人常年用某款特定的炒菜锅手法越来越熟练但换口锅可能就不适应了。坏习惯太依赖顺手的那口锅这种深度磨合有个副作用模型被惯坏了。举个例子Codex-5.3 被训练使用一种特定的apply_patch打补丁方式来修改代码文件。这种特定的方法可能是按 A 格式读取旧代码再按 B 格式生成新代码。按理说一个真正聪明的程序员不管你给他什么编辑工具是直接覆盖文件、用 diff 对比、还是用补丁方式他都应该能完成修改任务。但实际上如果你把apply_patch的实现方式稍微改一改比如从读取生成改成直接覆盖Codex-5.3 的表现就会明显下降。因为它已经形成肌肉记忆了不是学会了怎么编辑文件这个通用技能而是习惯了用特定格式打补丁这个具体操作。这就是过拟合模型对特定工具的实现细节形成了依赖失去了灵活应变的能力。好消息你可以给它换口更顺手的锅但这也带来一个机会即使模型是在某个特定驾驭层里训练出来的你也可以通过优化驾驭层让它表现得更好。Terminal Bench 2.0一个编程能力排行榜证明了这一点。同样是 Opus 4.6 这个模型在 Claude Code 自带的驾驭层里它排名靠后。但 LangChain 团队只是调整了驾驭层的配置换了更合适的工具组合、优化了提示词方式、调整了执行流程同样的模型就从前30名冲进了前5名。这说明什么就像给同一个程序员换了一套更顺手的开发环境、更清晰的文档、更合理的快捷键他的产出效率就能大幅提升。所以别认为官方默认配置就是最好的。即使模型是在特定环境中训练出来的针对你的具体任务继续优化驾驭层往往能获得远超预期的收益。还有很多潜力可以挖掘。4.2 驾驭层工程的发展方向随着模型能力越来越强今天存在于驾驭层中的一些功能将被吸收到模型中。模型将在规划、自我验证和长时程连贯性方面天生变得更好因此例如需要更少的上下文注入。这表明驾驭层的重要性会随时间降低。但就像提示工程prompt engineering今天仍然有价值一样驾驭层工程harness engineering很可能在构建优秀智能体方面继续有用。确实今天的驾驭层弥补了模型的不足但它们也围绕模型智能工程化系统使其更加有效。配置良好的环境、正确的工具、持久状态和验证循环能让任何模型更高效无论其基础智能如何。驾驭层工程是一个非常活跃的研究领域在 LangChain 用它来改进驾驭层构建库 deepagents。PSOpenClaw 之后Harness Engineering 到底是什么在企业如何落地有哪些使用场景具体的实践经验是什么今晚开场直播详细讲解欢迎点击预约直播见。好了这就是我今天想分享的内容。如果你对构建企业级 AI 原生应用新架构设计和落地实践感兴趣别忘了点赞、关注噢~—1—加我微信扫码加我有很多不方便公开发公众号的我会直接分享在朋友圈欢迎你扫码加我个人微信来看加星标★不错过每一次更新⬇戳”阅读原文“立即预约

相关文章:

智能体 Harness Engineering (驾驭工程) 架构设计剖析

大家好,我是玄姐。PS:OpenClaw 之后,Harness Engineering 到底是什么?在企业如何落地?有哪些使用场景?具体的实践经验是什么?今晚开场直播详细讲解,欢迎点击预约,直播见。…...

别再只盯着成功率了!聊聊视觉语言导航里那些‘坑’:从SG-Nav到TriHelper的实战避雷心得

视觉语言导航实战避坑指南:从SG-Nav到TriHelper的工程化思考 视觉语言导航(VLN)作为具身智能领域的前沿方向,近年来在学术论文中展现出令人振奋的性能指标。但当研究人员真正将这些框架部署到实际项目时,往往会发现论文…...

CoPaw提示词(Prompt)工程入门:从零编写高效指令的10个技巧

CoPaw提示词(Prompt)工程入门:从零编写高效指令的10个技巧 1. 为什么需要学习提示词工程 你可能已经发现,同样的AI模型,不同人用起来效果天差地别。有人随便输入几个词就能得到专业级回答,有人写了一大段…...

科研党福音:用MinerU开源方案,5分钟搞定论文PDF的公式与参考文献解析

科研效率革命:MinerU开源工具5分钟实现论文PDF智能解析 在凌晨三点的实验室里,面对堆积如山的参考文献,你是否也曾为手动复制公式和参考文献而抓狂?传统文献调研中,研究人员平均需要花费27%的工作时间在机械性的信息摘…...

AI绘画实战:用ComfyUI+FLUX.1模型生成高质量写实人像的完整工作流

AI绘画实战:用ComfyUIFLUX.1模型生成高质量写实人像的完整工作流 在数字艺术创作领域,AI绘画正以惊人的速度重塑创作流程。对于追求写实人像品质的创作者而言,掌握ComfyUI与FLUX.1模型的协同工作流,相当于获得了数字画布上的超现实…...

从零到一:基于开源Geo技术栈构建企业级SaaS化GIS平台

1. 为什么选择开源Geo技术栈构建企业级SaaS平台 十年前我第一次接触GIS系统时,商业软件动辄上百万的授权费让很多中小企业望而却步。如今开源Geo技术栈的成熟度已经足以支撑企业级应用,这让我想起去年帮一家物流公司搭建货运监控系统的经历——他们用30%…...

OpenWrt网络配置实战:从基础到高级

1. OpenWrt网络配置入门指南 第一次接触OpenWrt的朋友可能会被它的命令行界面吓到,其实它的网络配置逻辑非常清晰。我刚开始玩OpenWrt时也走过不少弯路,后来发现只要掌握几个核心概念就能轻松上手。OpenWrt的网络配置主要存储在/etc/config目录下&#x…...

SenseVoice语音识别应用案例:智能座舱多语言交互系统搭建指南

SenseVoice语音识别应用案例:智能座舱多语言交互系统搭建指南 1. 智能座舱语音交互的挑战与机遇 现代汽车正在经历一场数字化革命,智能座舱作为人车交互的核心界面,其重要性日益凸显。语音交互作为最自然、最安全的交互方式,已经…...

别再乱拖了!Vivado I/O约束的三种界面操作(Package/Device/Ports)保姆级对比与选择指南

Vivado I/O约束三大界面操作全解析:从入门到精通的实战选择策略 在FPGA开发中,I/O约束的正确配置往往决定着整个设计的成败。作为Xilinx官方推荐的开发环境,Vivado提供了三种不同的I/O约束操作方法——I/O Ports表格、Package引脚拖拽和Devic…...

从浪涌抑制到恒温加热:手把手拆解NTC和PTC在开关电源与电机保护中的经典电路

从浪涌抑制到恒温加热:手把手拆解NTC和PTC在开关电源与电机保护中的经典电路 在硬件设计领域,热敏电阻的应用往往决定了电路的可靠性与稳定性。NTC和PTC这两种看似简单的元件,却能在关键时刻成为系统安全的守护者。本文将带您深入两种典型电路…...

Veeam Backup Replication 13实战:5分钟搞定VMware ESXi虚拟机备份(附邮件提醒配置)

Veeam Backup & Replication 13实战:5分钟高效备份VMware ESXi虚拟机 在虚拟化环境中,数据安全始终是IT管理员最关心的问题之一。当企业依赖VMware ESXi运行关键业务时,如何快速建立可靠的备份机制成为刚需。Veeam Backup & Replicat…...

【2024高可用API架构白皮书】:基于17个真实生产环境MCP迁移案例,总结REST不可替代的3种场景与必须替换的4类接口

第一章:MCP协议与传统REST API性能对比的基准认知在分布式系统通信演进过程中,MCP(Message-Centric Protocol)作为一种面向消息流优化的二进制协议,正逐步挑战REST/HTTP在微服务间调用中的默认地位。理解其与传统REST …...

YOLO12模型迁移学习教程:自定义数据集训练与WebUI部署

YOLO12模型迁移学习教程:自定义数据集训练与WebUI部署 1. 引言 目标检测是计算机视觉领域的核心任务之一,而YOLO系列模型一直是这个领域的明星选手。最新发布的YOLO12带来了全新的以注意力为中心的架构,在保持实时性能的同时显著提升了检测…...

CORS配置错误如何成为HttpOnly Cookie的“后门”?

1. 当安全防线出现裂缝:HttpOnly与CORS的微妙关系 第一次在项目中启用HttpOnly属性时,我天真地以为给Cookie套上了金钟罩。直到某天凌晨三点,运维同事的电话把我从睡梦中惊醒:"用户数据在未经授权的情况下被批量导出&#xf…...

告别模块堆叠:用UniAD的Transformer统一框架,重新理解自动驾驶的‘大脑’如何工作

自动驾驶架构革命:UniAD如何用Transformer重构系统设计范式 当Waymo的自动驾驶车辆在旧金山街头自如穿行时,大多数观察者只看到了流畅的行驶表现,却鲜少有人思考背后那个处理海量数据的"数字大脑"正在经历怎样的范式转变。传统自动…...

弦音墨影效果实测:Qwen2.5-VL在1080P/4K视频中的实时定位延迟分析

弦音墨影效果实测:Qwen2.5-VL在1080P/4K视频中的实时定位延迟分析 1. 引言:当AI遇见水墨,实时定位的效能如何? 想象一下,你正在观看一部高清的自然纪录片,画面中猎豹正在追逐羚羊。你想知道:“…...

Jimeng AI Studio与IDEA集成:Java AI开发环境配置

Jimeng AI Studio与IDEA集成:Java AI开发环境配置 让Java开发者也能轻松玩转AI:5分钟搞定环境配置,快速开启智能应用开发 作为一名Java开发者,你可能已经习惯了在IntelliJ IDEA中编写代码、调试程序。但当想要尝试AI应用开发时&am…...

从20英镑纸币到你的电路板:聊聊法拉第和他‘命名’的电容器发展简史

从20英镑纸币到你的电路板:法拉第与电容器技术演进的百年对话 伦敦皇家学院的地下实验室里,迈克尔法拉第正用自制的莱顿瓶进行着一项危险实验。这位装订工出身的科学家不会想到,一个半世纪后,他名字命名的电子元件会以毫米级尺寸存…...

Windows下用VSCode+WSL2搭建RV1106开发环境(附避坑指南)

Windows下高效搭建RV1106开发环境:VSCode与WSL2深度整合指南 嵌入式开发工程师常常面临一个两难选择:既需要Linux环境下的开发工具链,又希望保留Windows系统的易用性。本文将详细介绍如何通过VSCode与WSL2的无缝整合,在Windows系统…...

Syslab绘图入门:从安装Plots库到3D曲面绘制(附MATLAB对比)

Syslab绘图实战指南:从环境搭建到3D可视化进阶(含MATLAB对照) 在数据科学和工程计算领域,可视化工具的选择往往直接影响研究效率和成果呈现质量。Syslab作为新兴的科学计算环境,其绘图系统虽然借鉴了MATLAB的部分设计理…...

【UE4】蓝图转C++实战:从零构建双摇杆射击游戏的核心逻辑

1. 从蓝图到C:为什么要转换? 很多UE4开发者都是从蓝图开始入门的,这种可视化编程方式确实对新手非常友好。但当你项目规模变大时,蓝图会变得越来越臃肿,这时候就需要考虑将核心逻辑迁移到C中。我在开发双摇杆射击游戏时…...

海康考勤机数据对接的两种方式对比:HTTP推送 vs SDK调用,哪个更适合你?

海康考勤机数据对接方案深度解析:HTTP推送与SDK调用的实战选择指南 考勤系统作为企业人力资源管理的核心组件,其数据对接的稳定性和效率直接影响着薪资核算、绩效考核等关键业务流程。海康威视作为安防领域的龙头企业,其考勤设备在市场上占据…...

gte-base-zh保姆级教程:零基础搭建中文语义搜索系统

gte-base-zh保姆级教程:零基础搭建中文语义搜索系统 1. 环境准备与模型部署 1.1 了解gte-base-zh模型 gte-base-zh是由阿里巴巴达摩院研发的中文文本嵌入模型,基于BERT架构优化而来。这个模型特别擅长理解中文文本的深层语义,能够将任意长…...

手机APP用户行为分析市场洞察:2026 - 2032年复合年增长率(CAGR)为9.0%

据恒州诚思调研统计,2025年全球手机APP用户行为分析收入规模约达347.6亿元,预计到2032年,这一规模将接近669.3亿元,2026 - 2032年复合年增长率(CAGR)为9.0%。在移动互联网蓬勃发展、用户需求日益多样化的当…...

论文省心了!高效论文写作全流程AI论文软件推荐(2026 最新)

论文写作全流程可拆解为文献调研→选题/开题→大纲/初稿→文献综述→降重/去AI味→润色/格式→查重/投稿七大环节,以下工具按环节精准匹配,兼顾中文适配、降重能力、去AI痕迹、学术合规四大核心需求,覆盖免费/付费、通用/垂直场景。2026年AI论…...

3大核心功能+全场景解决方案:Linux系统高效制作Windows启动盘教程

3大核心功能全场景解决方案:Linux系统高效制作Windows启动盘教程 【免费下载链接】WoeUSB-ng WoeUSB-ng is a simple tool that enable you to create your own usb stick windows installer from an iso image or a real DVD. This is a rewrite of original WoeUS…...

制造业知识管理革命:RexUniNLU技术实施方案

制造业知识管理革命:RexUniNLU技术实施方案 1. 引言 在制造业的日常运营中,技术文档查询是个让人头疼的问题。新员工面对厚厚的设备手册不知所措,老师傅退休后宝贵经验无处可寻,生产线遇到故障时技术员翻遍文档也找不到解决方案…...

盲目砍库存?精益生产靠这几项指标,盘活库存不踩坑

在制造企业的日常运营中,库存积压始终是悬在管理者头顶的难题:大量原材料、在制品、成品占用巨额流动资金,仓库空间饱和、物料积压过期,不仅拉高仓储、资金占用成本,还掩盖了生产效率低、设备故障频发、供应链协同差、…...

电源设计小白必看:TL431补偿电路参数调节实战(附波特图分析)

TL431补偿电路参数调节实战指南:从波特图分析到闭环优化 作为一名电源设计工程师,第一次面对TL431补偿电路时,那种既兴奋又忐忑的心情至今记忆犹新。记得当时为了调试一个简单的反激电源,整整三天都卡在环路补偿环节,直…...

CLIP-GmP-ViT-L-14惊艳效果:模糊/旋转/裁剪图像仍保持Top1文本匹配稳定性

CLIP-GmP-ViT-L-14惊艳效果:模糊/旋转/裁剪图像仍保持Top1文本匹配稳定性 1. 模型效果惊艳展示 CLIP-GmP-ViT-L-14模型在图像识别领域展现了令人惊叹的稳定性。即使在图像经过模糊、旋转或裁剪处理后,该模型仍能保持Top1级别的文本匹配准确率。这种稳定…...