当前位置: 首页 > article >正文

GLM-5.1 全面支持与 Gemini CLI 集成:HagiCode 的多模型进化之路

GLM-5.1 全面支持与 Gemini CLI 集成HagiCode 的多模型进化之路本文介绍了 HagiCode 平台近期的重要更新——智谱 AI GLM-5.1 模型的全面支持以及 Gemini CLI 作为第十个 Agent CLI 的成功集成。这两项更新进一步强化了平台的多模型能力和多 CLI 生态。背景时间过得真快大语言模型的发展就像春天的竹子一样蹭蹭地往上窜。曾经我们还在为一个能写代码的 AI而欢呼雀跃如今已是多模型协同、多工具融合的时代了。这有意思吗或许吧毕竟开发者需要的从来都不只是工具本身而是一种能够适应不同场景、灵活切换的从容。HagiCode 作为一个 AI 辅助编码平台最近也算是迎来了两件大事一是智谱 AI 的 GLM-5.1 模型全面接入二是 Gemini CLI 正式成为第十个支持的 Agent CLI。这两件事说大不大说小也不小只是对于平台的完善而言总归是好事一桩。GLM-5.1 是智谱 AI 的最新旗舰模型相比 GLM-5.0推理能力更强了代码理解更深了工具调用也更顺滑了。更重要的是它是首个支持图片输入的 GLM 模型——这意味着什么意味着用户可以直接截图让 AI 看问题不用再费劲巴力地描述了。这便利性用过就懂了。与此同时HagiCode 通过 HagiCode.Libs.Providers 架构把 Gemini CLI 成功集成了进来。这是第十个 Agent CLI 了说实话能走到这一步也算是有些许成就感罢了。值得一提的是HagiCode 的图片上传功能让用户可以直接截图与 AI 交流。即使运行的是 GLM 4.7 版本平台依然能够良好运行并且已经帮助项目完成了许多重要的构建工作。至于 GLM-5.1那自然会更进一步。关于 HagiCode本文分享的方案来自我们在 HagiCode 项目中的实践经验。HagiCode 是一个开源的 AI 辅助编码平台旨在通过多模型、多 CLI 的架构设计为开发者提供灵活、强大的 AI 编程助手。项目地址github.com/HagiCode-org/site多 CLI 架构设计HagiCode 的核心优势之一就是通过统一的抽象层支持多种不同的 AI 编程 CLI 工具。这种设计的好处说穿了也就那么回事新东西能进来旧东西能留下代码还不乱。毕竟谁都希望生活能这样吧AIProviderType 枚举平台通过AIProviderType枚举定义了支持的 CLI 提供商类型publicenumAIProviderType{ClaudeCodeCli0,// Claude Code CLICodexCli1,// GitHub Copilot CodexGitHubCopilot2,// GitHub CopilotCodebuddyCli3,// Codebuddy CLIOpenCodeCli4,// OpenCode CLIIFlowCli5,// IFlow CLIHermesCli6,// Hermes CLIQoderCli7,// Qoder CLIKiroCli8,// Kiro CLIKimiCli9,// Kimi CLIGeminiCli10,// Gemini CLI (新增)}可以看到Gemini CLI 作为第十个成员加入了这个大家庭。每个 CLI 都有独特的特点和适用场景用户可以根据自己的需求灵活选择。毕竟条条大路通罗马只是有的路好走一点有的路稍微曲折一点罢了。Provider 架构HagiCode.Libs.Providers 提供了统一的 Provider 接口让每个 CLI 的集成变得规范而简洁。以 Gemini CLI 为例publicclassGeminiProvider:ICliProviderGeminiOptions{privatestaticreadonlystring[]DefaultExecutableCandidates[gemini,gemini-cli];privateconststringManagedBootstrapArgument--acp;publicstringNamegemini;publicboolIsAvailable_executableResolver.ResolveFirstAvailablePath(DefaultExecutableCandidates)isnotnull;}这种设计的好处是新 CLI 的集成只需要实现一个 Provider 类统一的生命周期管理和会话池化自动化的别名解析和可执行文件查找说穿了这种设计其实就是把复杂的事情简单化让生活更轻松一点罢了。Provider RegistryProvider Registry 自动处理别名映射和注册if(providerisGeminiProvider){registry.Register(provider.Name,provider,[gemini-cli]);continue;}这意味着用户可以使用gemini或gemini-cli两种方式来调用 Gemini CLI系统会自动识别。这就像你朋友多有的叫大名有的叫小名反正都是他怎么叫都行。GLM-5.1 模型支持GLM-5.1 是智谱 AI 的最新旗舰模型HagiCode 已完成对其的全面支持。Secondary Professions CatalogHagiCode 通过 Secondary Professions Catalog 管理所有支持的模型。以下是 GLM 系列的配置Model IDNameSupportsImageCompatible CLI Familiesglm-4.7GLM 4.7-claude, codebuddy, hermes, qoder, kiroglm-5GLM 5-claude, codebuddy, hermes, qoder, kiroglm-5-turboGLM 5 Turbo-claude, codebuddy, hermes, qoder, kiroglm-5.0GLM 5.0 (Legacy)-claude, codebuddy, hermes, qoder, kiroglm-5.1GLM 5.1trueclaude, codebuddy, hermes, qoder, kiroGLM-5.1 的关键特性可以总结为独立的版本标识没有 legacy 包袱首个支持图片输入的 GLM 模型更强的推理能力和代码理解广泛的多 CLI 兼容性GLM-5.1 vs GLM-5.0从代码层面来看GLM-5.1 与 GLM-5.0 的关键区别// GLM-5.0 (Legacy) - 有特殊保留逻辑privateconststringGlm50CodebuddySecondaryProfessionIdsecondary-glm-5-codebuddy;privateconststringGlm50CodebuddyModelValueglm-5.0;// GLM-5.1 - 独立的新模型标识privateconststringGlm51SecondaryProfessionIdsecondary-glm-5-1;privateconststringGlm51ModelValueglm-5.1;GLM-5.0 带有 “Legacy” 标记是为了向后兼容而保留的旧版本标识。而 GLM-5.1 是一个全新的独立版本没有任何历史包袱。这就像有些人总是活在过去而有些人轻装上阵走得更快罢了。配置 GLM-5.1在 HagiCode 中使用 GLM-5.1 的配置示例{primaryProfessionId:profession-claude-code,secondaryProfessionId:secondary-glm-5-1,model:glm-5.1,reasoning:high}图片上传功能HagiCode 的图片支持是通过 SecondaryProfession 的SupportsImage属性实现的publicclassHeroSecondaryProfessionSettingDto{publicboolSupportsImage{get;set;}}在 Secondary Professions Catalog 中GLM-5.1 的配置如下{id:secondary-glm-5-1,supportsImage:true}这意味着用户可以直接上传截图让 AI 分析比如错误信息的截图UI 界面的问题数据可视化图表代码运行结果不用再手动描述问题了直接截图就行——这个功能的便利性用过就知道了。毕竟有些事情说再多不如看一眼。Gemini CLI 集成Gemini CLI 作为第十个 Agent CLI通过标准的 Provider 架构集成到 HagiCode 中。配置选项Gemini CLI 支持丰富的配置选项publicclassGeminiOptions{publicstring?ExecutablePath{get;set;}publicstring?WorkingDirectory{get;set;}publicstring?SessionId{get;set;}publicstring?Model{get;set;}publicstring?AuthenticationMethod{get;set;}publicstring?AuthenticationToken{get;set;}publicDictionarystring,string?AuthenticationInfo{get;set;}publicDictionarystring,string?EnvironmentVariables{get;set;}publicstring[]ExtraArguments{get;set;}publicTimeSpan?StartupTimeout{get;set;}publicCliPoolSettings?PoolSettings{get;set;}}这些选项覆盖了从基本配置到高级特性的方方面面用户可以根据自己的需求进行灵活配置。毕竟每个人的需求都不一样能灵活一点总是好的。ACP 通信协议Gemini CLI 支持 ACP (Agent Communication Protocol) 通信协议这是 HagiCode 统一的 CLI 通信标准。通过 ACP不同的 CLI 可以以一致的方式与平台交互大大简化了集成工作。说穿了就是把复杂的事情统一化让大家都能轻松一点罢了。环境配置使用智谱 AI 的模型需要配置相应的环境变量。智谱 AI ZAI 平台exportANTHROPIC_AUTH_TOKENyour-zai-api-keyexportANTHROPIC_BASE_URLhttps://open.bigmodel.cn/api/anthropic阿里云 DashScopeexportANTHROPIC_AUTH_TOKENyour-aliyun-api-keyexportANTHROPIC_BASE_URLhttps://coding.dashscope.aliyuncs.com/apps/anthropic配置完成后HagiCode 就可以正常调用 GLM-5.1 模型了。这事儿说难也不难说简单也不简单反正照着做就是了。HagiCode 自身构建实践说到实践最好的例子就是 HagiCode 平台自身的构建流程。HagiCode 的开发过程已经充分利用了 AI 能力使用 GLM 4.7 即可良好运行HagiCode 平台的设计优化得比较好即使使用 GLM 4.7 也能获得良好的开发体验。平台已帮助完成多个重要构建项目包括多 CLI Provider 的集成图片上传功能的实现文档生成和内容发布这其实也挺好毕竟不是所有人都需要用最新的东西。适合自己的才是最好的。GLM-5.1 事半功倍升级到 GLM-5.1 后这些能力将得到进一步增强更强的代码理解能力减少来回沟通更准确的依赖分析一次性指对方向更高效的错误诊断快速定位问题支持图片输入加速问题描述这就像从自行车换到汽车能到的地方是一样的只是速度和舒适度不一样罢了。多 CLI 集成最佳实践HagiCode.Libs.Providers 提供了统一的注册和使用机制services.AddHagiCodeLibs();vargeminiserviceProvider.GetRequiredServiceICliProviderGeminiOptions();varcodebuddyserviceProvider.GetRequiredServiceICliProviderCodebuddyOptions();varhermesserviceProvider.GetRequiredServiceICliProviderHermesOptions();这种依赖注入的设计让各个 CLI 的使用变得非常简洁也方便进行单元测试和模拟。毕竟代码写得干净一点对自己也是一种负责。注意事项在实际使用中有几个地方需要注意API Key 配置确保正确设置ANTHROPIC_AUTH_TOKEN否则无法调用模型模型可用性GLM-5.1 需要在对应的模型提供商处开通权限图片功能只有支持supportsImage: true的模型才能使用图片上传功能CLI 安装使用 Gemini CLI 前确保gemini或gemini-cli在系统 PATH 中这些都是小事但小事处理不好也可能变成大事。所以还是要注意一下的。总结通过 GLM-5.1 的全面支持和 Gemini CLI 的成功集成HagiCode 进一步强化了其作为多模型、多 CLI AI 编程平台的能力。这些更新不仅为用户提供了更多的选择也展示了 HagiCode 在架构设计上的前瞻性和可扩展性。GLM-5.1 的图片支持能力结合 HagiCode 的截图上传功能让看图说话成为可能——大大降低了问题描述的成本。而十个 CLI 的支持意味着用户可以根据自己的偏好和场景灵活选择最合适的 AI 编程助手。毕竟选择多了总是好事。最重要的是HagiCode 平台自身的构建实践证明即使使用 GLM 4.7平台也能良好运行并完成复杂任务而升级到 GLM-5.1 后开发效率将得到进一步提升。这就像人生一样不一定非要追求最好适合自己的就好。当然如果能在适合自己的基础上变得更好那自然更好。如果你对多模型、多 CLI 的 AI 编程平台感兴趣不妨试试 HagiCode——开源、免费、不断进化。反正试试又不花钱万一真适合你呢参考资料HagiCode GitHub 仓库HagiCode 官网智谱 AI 开放平台Gemini CLI 文档Docker Compose 快速安装Desktop 桌面端安装如果本文对你有帮助来 GitHub 给个 Stargithub.com/HagiCode-org/site访问官网了解更多hagicode.com观看 30 分钟实战演示www.bilibili.com/video/BV1pirZBuEzq/一键安装体验docs.hagicode.com/installation/docker-compose公测已开始欢迎安装体验原文与版权说明感谢您的阅读,如果您觉得本文有用,欢迎点赞、收藏和分享支持。本内容采用人工智能辅助协作,最终内容由作者审核并确认。本文作者: newbe36524原文链接: https://docs.hagicode.com/go?platformcsdntarget%2Fblog%2F2026-03-30-hagicode-glm-5-1-gemini-cli-update%2F版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!

相关文章:

GLM-5.1 全面支持与 Gemini CLI 集成:HagiCode 的多模型进化之路

GLM-5.1 全面支持与 Gemini CLI 集成:HagiCode 的多模型进化之路 本文介绍了 HagiCode 平台近期的重要更新——智谱 AI GLM-5.1 模型的全面支持,以及 Gemini CLI 作为第十个 Agent CLI 的成功集成。这两项更新进一步强化了平台的多模型能力和多 CLI 生态…...

3大核心价值!六音音源开源工具:洛雪音乐跨版本修复解决方案

3大核心价值!六音音源开源工具:洛雪音乐跨版本修复解决方案 【免费下载链接】New_lxmusic_source 六音音源修复版 项目地址: https://gitcode.com/gh_mirrors/ne/New_lxmusic_source 在数字音乐体验日益依赖软件生态的今天,洛雪音乐1.…...

别再死记硬背公式了!用Simulink玩转单相全桥逆变,从方波驱动到IGBT参数设置全解析

用Simulink玩转单相全桥逆变:从方波驱动到IGBT参数设置的实战指南 电力电子领域的学习常常陷入公式推导的泥潭,而Simulink提供的可视化仿真环境就像一盏明灯。想象一下,当你调整一个参数就能立即看到波形变化,比纸上推导要直观十倍…...

pvr.iptvsimple技术解构:IPTV直播系统构建的底层逻辑与实践指南

pvr.iptvsimple技术解构:IPTV直播系统构建的底层逻辑与实践指南 【免费下载链接】pvr.iptvsimple IPTV Simple client for Kodi PVR 项目地址: https://gitcode.com/gh_mirrors/pv/pvr.iptvsimple 问题定位:IPTV直播系统的技术痛点与架构挑战 IP…...

忍者像素绘卷入门必看:Z-Image-Turbo模型结构精简与推理速度提升原理

忍者像素绘卷入门必看:Z-Image-Turbo模型结构精简与推理速度提升原理 1. 项目概述 忍者像素绘卷是一款基于Z-Image-Turbo深度优化的图像生成工作站,专为16-Bit复古游戏美学风格设计。它采用明亮的"云端"视觉设计,为用户提供清爽且…...

AI驱动的科研绘图革命:DeTikZify如何终结图表代码的手动时代

AI驱动的科研绘图革命:DeTikZify如何终结图表代码的手动时代 【免费下载链接】DeTikZify Synthesizing Graphics Programs for Scientific Figures and Sketches with TikZ 项目地址: https://gitcode.com/gh_mirrors/de/DeTikZify 当deadline遇上绘图难题&a…...

TensorFlow实战:用CIFAR-10数据集训练你的第一个图像分类模型(附完整代码)

TensorFlow图像分类实战:从零构建CIFAR-10卷积神经网络的完整指南 当第一次接触图像分类任务时,许多开发者会被复杂的网络结构和数据处理流程所困扰。本文将带你用TensorFlow构建一个能识别10类常见物体的卷积神经网络,从数据加载到模型评估&…...

深度学习环境搭建不再难:PyTorch 2.6镜像快速部署指南

深度学习环境搭建不再难:PyTorch 2.6镜像快速部署指南 1. 为什么选择PyTorch 2.6镜像 PyTorch作为当前最流行的深度学习框架之一,其2.6版本带来了显著的性能提升和新特性。但对于初学者来说,从零开始配置PyTorch环境往往面临诸多挑战&#…...

MAX32630FTHR平台RF95 LoRa精简移植实战

1. RadioHead库深度解析:面向MAX32630FTHR平台的RF95 LoRa通信精简移植 1.1 项目定位与工程价值 RadioHead并非官方标准协议栈,而是由Airspayce公司开发的一套轻量级、跨平台无线通信抽象库。其设计哲学强调“最小可行通信”——不追求协议完备性&#…...

【GIS】深入解析地理学中的尺度三重性:Size、Level、Relation的实践应用

1. 尺度三重性:GIS分析的基石 第一次接触"尺度"概念时,我也被各种术语绕晕过——为什么1:10000叫大比例尺却显示小范围?为什么生态学家说的"尺度"和城市规划师说的完全不是一回事?直到把尺度拆解成Size&#…...

vue基于springboot的目的地旅游预订网站

目录同行可拿货,招校园代理 ,本人源头供货商功能模块划分技术实现要点扩展功能建议性能优化方向项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作同行可拿货,招校园代理 ,本人源头供货商 功能模块划分 用户模块 用户注册与登录…...

vue基于springboot架构的酒店管理系统 酒店商城购物系统

目录同行可拿货,招校园代理 ,本人源头供货商功能模块分析技术实现要点扩展功能建议项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作同行可拿货,招校园代理 ,本人源头供货商 功能模块分析 酒店管理系统功能 客房管理&#xff…...

5个宝藏级3D模型下载站:从GLB到Blender,一站式解决你的建模素材需求

1. 为什么你需要这些3D模型资源站? 作为一个在3D建模领域摸爬滚打多年的老手,我深知找素材的痛苦。记得刚入行时,为了找一个简单的沙发模型,我花了整整三天翻遍各种论坛和资源站。现在回头看,如果当时有人给我一份靠谱…...

ROS Noetic下用Python脚本在Gazebo里动态生成障碍物(附完整代码和常见报错解决)

ROS Noetic下Python脚本动态生成Gazebo障碍物的工程实践 在机器人仿真测试中,动态生成环境障碍物是验证导航算法鲁棒性的关键手段。传统手动拖拽方式效率低下且难以复现特定测试场景,而通过编程控制Gazebo仿真环境则能实现测试流程的自动化与标准化。本文…...

基于Kubernetes Operator的MySQL InnoDB Cluster自动化部署实践

1. MySQL InnoDB Cluster与Kubernetes Operator基础 MySQL InnoDB Cluster是MySQL官方提供的高可用数据库解决方案,它基于MySQL Group Replication技术构建,能够实现多节点数据同步和自动故障转移。想象一下,这就像是一个由多个数据库实例组…...

微信H5支付v3版Java实战:从零构建移动端支付解决方案

1. 微信H5支付的应用场景与优势 移动端支付已经成为现代商业不可或缺的一部分。微信H5支付作为微信支付生态中的重要一环,特别适合那些需要在非微信客户端浏览器中实现支付功能的场景。想象一下这样的画面:用户在手机浏览器中浏览你的电商网站&#xff…...

【手把手实战!fMRI数据预处理全流程解析】SPM12操作指南

1. fMRI数据预处理入门:为什么需要SPM12? 第一次接触fMRI数据分析的朋友,往往会被各种专业术语吓到——DICOM、NIFTI、头动校正、空间标准化...这些名词听起来就让人头大。但别担心,就像我第一次在实验室处理数据时导师说的&…...

OpenCode效果实测:基于Qwen3-4B的代码生成质量与速度展示

OpenCode效果实测:基于Qwen3-4B的代码生成质量与速度展示 1. 项目概览与技术背景 OpenCode是2024年开源的AI编程助手框架,采用Go语言开发,主打"终端优先、多模型、隐私安全"的设计理念。该项目将大语言模型(LLM)包装成可插拔的Ag…...

静息态fMRI分析避坑指南:DPARSFA预处理中那些容易踩的‘雷’(附解决方案)

静息态fMRI分析实战避坑手册:DPARSFA预处理中的7个致命陷阱与修复方案 当你熬夜跑完DPARSFA预处理流程,满心期待地点开结果图时——突然发现ReHo图像像被泼了墨水,fALFF数值全部溢出,或是软件弹出一串看不懂的报错代码。这种崩溃…...

千问3.5-2B博物馆导览:展品图理解、说明牌OCR与个性化讲解生成

千问3.5-2B博物馆导览:展品图理解、说明牌OCR与个性化讲解生成 1. 博物馆导览新体验 想象一下,当你站在博物馆的展品前,只需用手机拍下展品照片,就能立即获得专业的讲解内容、展品背景故事,甚至还能根据你的兴趣偏好…...

别再手动点啦!用Android无障碍服务+讯飞语音,5分钟实现App语音操控(保姆级教程)

用Android无障碍服务打造语音操控神器:5分钟实现"可见即可说" 你是否厌倦了在手机上反复点击屏幕的操作?想象一下,只需对着手机说出"打开微信"、"点击朋友圈"、"返回主页",设备就能自动完…...

解锁Claude无限潜能:技能生态系统的构建艺术

解锁Claude无限潜能:技能生态系统的构建艺术 【免费下载链接】awesome-claude-skills A curated list of awesome Claude Skills, resources, and tools for customizing Claude AI workflows 项目地址: https://gitcode.com/GitHub_Trending/aw/awesome-claude-s…...

ComfyUI翻译节点终极指南:如何选择最适合你的AI创作翻译工具

ComfyUI翻译节点终极指南:如何选择最适合你的AI创作翻译工具 【免费下载链接】ComfyUI_Custom_Nodes_AlekPet Custom nodes that extend the capabilities of Comfyui 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI_Custom_Nodes_AlekPet 在AI图像生…...

Vue3项目实战:5分钟搞定DeepSeek API对接,打造你的专属AI聊天助手

Vue3项目实战:5分钟搞定DeepSeek API对接,打造你的专属AI聊天助手 最近在重构个人博客时,突然想到如果能给访客加个智能问答助手应该挺酷的。作为一个长期混迹开源社区的全栈开发者,我习惯性先搜了圈现有方案——结果发现DeepSeek…...

如何彻底解决文献格式混乱?Zotero格式规范化处理工具的创新方案

如何彻底解决文献格式混乱?Zotero格式规范化处理工具的创新方案 【免费下载链接】zotero-format-metadata Linter for Zotero. A plugin for Zotero to format item metadata. Shortcut to set title rich text; set journal abbreviations, university places, and…...

从攻到防:实战演练基于Wireshark与Snort的DoS攻击检测

1. 拒绝服务攻击初探:原理与危害剖析 想象一下周末去热门餐厅吃饭的场景。当所有座位都被占满,门口还不断涌入大量"假顾客"时,真正的食客就会被挡在门外——这就是拒绝服务攻击(DoS)的生动写照。作为网络安…...

除了阿里云,还有哪些靠谱的身份证实名认证方案?SpringBoot整合横向评测

SpringBoot整合主流身份证实名认证API横向评测:从阿里云到多服务商技术选型指南 当你的应用需要接入身份证实名认证功能时,阿里云可能只是众多选项中的一个起点。作为技术决策者,如何在腾讯云、百度智能云、聚合数据等众多服务商中做出最优选…...

DAMOYOLO-S快速上手:移动端浏览器访问Web服务与触屏操作适配说明

DAMOYOLO-S快速上手:移动端浏览器访问Web服务与触屏操作适配说明 1. 开篇:一个能“看懂”世界的AI助手 想象一下,你正用手机拍一张街景照片,屏幕上立刻就能标出“汽车”、“行人”、“交通灯”,甚至“手提包”。这不…...

告别C盘爆满!手把手教你配置Miniforge,让所有虚拟环境乖乖待在D盘

彻底解放C盘空间:Miniforge虚拟环境全迁移至D盘实战指南 每次打开资源管理器看到C盘飘红的存储条,心跳都会漏半拍——这大概是Windows开发者最熟悉的焦虑场景。特别是当你发现conda创建的虚拟环境正悄无声息吞噬着宝贵的系统盘空间时,那种无…...

实战演练:基于快马平台生成学生成绩排名系统,掌握排序算法应用

最近在做一个学生成绩管理系统的实战项目,其中排序功能是核心模块。通过这个项目,我深刻体会到排序算法在实际应用中的重要性。下面分享一下我的实现思路和经验总结。 学生类设计 首先需要定义一个学生类,包含学号、姓名、各科成绩和总成绩等…...