当前位置: 首页 > article >正文

玩一玩微软的 bit 模型:BitNet. 一个 CPU 就能跑起来的大模型戮

一、 什么是 AI Skills从工具级到框架级的演化AI SkillsAI 技能 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初Skills 被视为“工具级”的增强如简单的文件读写或终端操作方便用户快速实现各种操作。然而在以 Solon AI 为代表的现代应用开发框架中AI Skills 已演化为一种更高维度的封装用于智能体应用开发。工具级Tool-level解决的是“手”的问题是具体的执行函数。框架级Framework-level解决的是“脑”的问题。它是工具Tools、指令Instruction与元数据Metadata的聚合体。它不仅包含执行逻辑还包含了准入检查、指令增强及工具染色能力。二、 AI Skills 应有的核心特性为了解决传统 Tool 模式下的上下文噪音、权限真空和行为失控一个成熟的 AI Skill 必须具备以下特质智能准入isSupported 只有满足特定意图、租户或环境条件时可称为提示词上下文技能才会被激活。避免无效工具对模型上下文的干扰和 Token 浪费。指令注入getInstruction 根据当前上下文为模型提供“行为准则”解决模型“该怎么做”的问题。工具路由getTools 根据当前上下文动态分发工具高度自治 技能内部闭环处理特定领域的逻辑对外部输出标准化的结果。三、 MCPAI 时代的万维网协议随着技能需求的爆发MCPModel Context Protocol模型上下文协议 应运而生。它是连接 AI 模型与外部数据/工具的标准协议。MCP 之于 AI正如 HTTP 之于万维网。在互联网时代HTTP 协议让任何浏览器都能访问任何服务器上的资源在 AI 时代MCP 协议让任何智能体都能无缝调用分布在不同物理位置、由不同厂商提供的技能。这种标准化彻底打破了“智能体”与“外部世界”之间的硬编码枷锁。四、 Tool 的分布式进化MCP Tool 的诞生Tool 的形态正在经历本质的变化从本地单体进化为 MCP Tool分布式 Tool。它具有物理位置透明性不再是内存中的一个函数而是一个个独立的分布式能力节点。这种“能力节点化”是 AI 走向微服务架构的第一步。传统 Tool 代码级耦合运行在 Agent 进程内部难以跨语言、跨环境复用。MCP Tool分布式 Tool 通过 MCP 协议暴露具有物理位置透明性。它不再是内存中的一个函数而是一个个独立的分布式能力节点。五、 架构映射从分布式的 MCP Tool 到 MCP SkillsTool 的分布式化为 AI Skills 的分布式化提供了自然的路径参考。当我们将一组具备业务逻辑、指令指导和工具集的 Skill 借助 MCP 协议进行发布时它便进化成了 MCP Skills。我们可以将 AI Agent 的分布式蓝图清晰地映射为传统架构MCP 相当于 RPC远程过程调用 它定义了模型与能力节点之间如何通信是智能体世界的底座管道。MCP Skills 相当于微服务Microservices 每个 Skill 就是一个独立的、具备业务语义的业务单元。题外之话Distributed AI Skills也可以借助传统 RPC 体系实现做的工作会更多些。六、 如何实现 MCP SkillsClient 与 Server 的协同实现 MCP Skills 的核心在于将 Skill 的生命周期语义映射到 MCP 协议的端点上。1. McpSkillClient远程技能的本地代理McpSkillClient 作为本地代理其职责是与远程服务握手并将网络调用包装成 Skill 接口。感知元数据通过约定路径同步远程元数据。动态映射在运行时将本地的 isSupported 或 getInstruction 调用转化为远程 MCP Tool 调用。工具过滤自动剔除标记为 hide 的管理类工具只给 LLM 呈现此时该看的业务工具。应用示例// 1. 构建 MCP 客户端提供者负责协议通信与 Schema 缓存McpClientProvider mcpClient McpClientProvider.builder().channel(McpChannel.STREAMABLE).url(http://localhost:8081/skill/order).build();// 2. 将 MCP 客户端进化为 Skill 代理McpSkillClient skillClient new McpSkillClient(mcpClient);// 3. 构建带有业务上下文的 PromptPrompt prompt Prompt.of(这个订单A001请查询订单详情。).attrPut(tenant_id, 1) // 注入租户上下文.attrPut(user_role, admin); // 注入角色权限// 4. 调用大模型技能将根据 Prompt 自动完成远程准入、指令获取、工具过滤chatModel.prompt(prompt).options(o - o.skillAdd(skillClient)).call();2. McpSkillServer具备感知的技能服务端通过继承 McpSkillServer开发者可以将本地业务逻辑导出为远程技能。生命周期暴露利用 ToolMapping 和 ResourceMapping 将 isSupported、getInstruction 等逻辑导出。智能感知服务端能通过传入的 Prompt 状态感知意图。例如根据角色权限决定 getToolsName 返回哪些工具。安全标记通过给管理端点添加 hide:1 标记确保系统级指令不会泄露给模型。应用示例McpServerEndpoint(channel McpChannel.STREAMABLE_STATELESS, mcpEndpoint /skill/order)public class OrderManagerSkillServer extends McpSkillServer {Overridepublic String description() {return 提供订单查询与取消的专业技能;}//智能准入根据 Prompt 内容与属性决定是否响应Overridepublic boolean isSupported(Prompt prompt) {// 语义检查意图是否相关boolean isOrderTask prompt.getUserContent().contains(订单);// 安全检查必须有租户 IDboolean hasTenant prompt.attr(tenant_id) ! null;return isOrderTask hasTenant;}//动态指令根据上下文为大模型注入实时“行为准则”Overridepublic String getInstruction(Prompt prompt) {String tenantName prompt.attrOrDefault(tenant_name, 未知租户);return 你现在是[ tenantName ]的订单主管。请只处理该租户下的订单数据禁止跨租户查询。;}//挂载钩子技能被激活时触发可用于注入初始化消息或记录日志Overridepublic void onAttach(Prompt prompt) {// 可以在此处通过 prompt.addMessage() 注入 Few-shot 或背景知识System.out.println(订单技能已挂载当前租户 prompt.attr(tenant_id));}/*** 动态能力发现根据用户权限决定暴露哪些工具* return null 表示暴露所有业务工具Empty 表示禁用所有工具List 表示精准暴露。*/Overridepublic List getToolsName(Prompt prompt) {List tools new ArrayList();// 基础权限所有合规用户可见tools.add(OrderQueryTool);// 细粒度权限仅 ADMIN 角色可见“取消订单”工具if (ADMIN.equals(prompt.attr(user_role))) {tools.add(OrderCancelTool);}return tools;}ToolMapping(description 根据订单号查询详情)public String OrderQueryTool(String orderId) {return 订单 orderId 状态已发货;}ToolMapping(description 取消指定订单)public String OrderCancelTool(String orderId) {return 订单 orderId 已成功取消;}}七、 必然性总结AI Skills 走分布式道路是不可逆转的解耦与复用 复杂技能如法律审计、专业代码重构不再需要在每个项目中重写而是作为服务独立存在。安全边界 敏感数据处理技能可以部署在专用的、受保护的内网环境中仅通过受控的 MCP 协议与公网 Agent 通信。异构生态 不同语言、不同算力环境下的能力都可以通过统一的 MCP 接口连接形成一个真正的“智能体微服务网络”。琳母脚事

相关文章:

玩一玩微软的 bit 模型:BitNet. 一个 CPU 就能跑起来的大模型戮

一、 什么是 AI Skills:从工具级到框架级的演化 AI Skills(AI 技能) 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初,Skills 被视为“工具级”的增强,如简单的文件读写或终端操作,方便用户快速…...

IEEE IoT-J | CoDrone:Depth Anything V2+VLM云边端协同,无人机自主导航飞行距离+40%

导读:———————————————————————————————————————————无人机自主导航面临一个两难困境:板载浅层DNN感知能力有限,遇到复杂环境容易碰撞;将计算卸载到边缘服务器又受网络波动影响&#x…...

Unity学习90天-第2天-认识键盘 / 鼠标输入(PC)并实现WASD 移动,鼠标控制物体转向

Hey!欢迎回来! 今天我们来搞定 Unity 的输入系统,重点讲 PC 端的键盘和鼠标。 学完这个,你就能做出 WASD 移动 鼠标控制转向的基础移动系统!输入系统Unity 有两套输入系统,新旧不兼容:旧输入&a…...

告别计算器!手把手教你用Xilinx CORDIC IP核在FPGA上实现小数开方(附完整Verilog代码)

告别计算器!手把手教你用Xilinx CORDIC IP核在FPGA上实现小数开方(附完整Verilog代码) 在数字信号处理、图像算法或控制系统设计中,平方根运算几乎无处不在。传统解决方案要么依赖软件计算(实时性差)&…...

3D Face HRN人脸重建模型应用:为AR滤镜快速生成精准面部网格

3D Face HRN人脸重建模型应用:为AR滤镜快速生成精准面部网格 1. 从2D到3D的魔法:人脸重建技术革新 想象一下这样的场景:你正在开发一款AR美颜滤镜,需要让虚拟特效精准贴合用户面部。传统方案依赖复杂的面部关键点检测&#xff0…...

如何永久保存微信聊天记录?WeChatMsg完整指南让记忆永不丢失

如何永久保存微信聊天记录?WeChatMsg完整指南让记忆永不丢失 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we…...

WarcraftHelper:魔兽争霸3终极兼容性工具,让经典游戏重获新生

WarcraftHelper:魔兽争霸3终极兼容性工具,让经典游戏重获新生 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 你是否还在为魔兽…...

GLM-4.1V-9B-Base惊艳效果:古诗词配图理解、AI绘画作品风格反推分析

GLM-4.1V-9B-Base惊艳效果:古诗词配图理解、AI绘画作品风格反推分析 1. 视觉多模态理解新标杆 GLM-4.1V-9B-Base是智谱最新开源的视觉多模态理解模型,在中文视觉理解领域展现出令人惊艳的能力。不同于常见的纯文本大模型,这款模型专精于图像…...

如何高效使用AutoDock Vina:3个实战技巧与完整工作流程指南

如何高效使用AutoDock Vina:3个实战技巧与完整工作流程指南 【免费下载链接】AutoDock-Vina AutoDock Vina 项目地址: https://gitcode.com/gh_mirrors/au/AutoDock-Vina AutoDock Vina是一款高效的开源分子对接软件,广泛应用于药物发现、蛋白质配…...

前端性能监控指南

前端性能监控指南:提升用户体验的关键 在当今快节奏的互联网时代,用户对网页加载速度和交互流畅度的要求越来越高。前端性能监控成为开发者优化用户体验、提升业务转化率的重要手段。本文将介绍前端性能监控的核心内容,帮助开发者从多个维度…...

WeChatExporter:解锁iOS微信聊天记录的自由备份终极指南

WeChatExporter:解锁iOS微信聊天记录的自由备份终极指南 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 你是否曾因误删重要微信聊天记录而懊恼?是…...

ofa_image-caption企业应用:制造业设备巡检图→故障部位+状态英文描述自动生成

ofa_image-caption企业应用:制造业设备巡检图→故障部位状态英文描述自动生成 1. 项目背景与价值 在制造业设备巡检中,每天都会产生大量的设备图像数据。传统的人工巡检图片分析需要经验丰富的工程师逐一查看,不仅效率低下,还容…...

从单点通信到批量处理:s7netplus如何优化西门子PLC数据传输性能

从单点通信到批量处理:s7netplus如何优化西门子PLC数据传输性能 【免费下载链接】s7netplus S7.NET -- A .NET library to connect to Siemens Step7 devices 项目地址: https://gitcode.com/gh_mirrors/s7/s7netplus 在工业自动化系统中,PLC&…...

AI失忆症有了新解法,哈佛团队开发海马体仿生技术,要用AI终结人类“遗忘史”

来源:DeepTech深科技排版:胡莉花遗忘是人类共有的经历,无论是对话、事件还是转瞬即逝的瞬间,我们终究会遗忘。但如果遗忘变成一个可选的选项,如果人类能够拥有完美且无限的记忆,世界会变成怎样?…...

基于Python的社区团购管理系统毕业设计

博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在设计并实现一套基于Python的社区团购管理系统,以解决当前社区团购业务中存在的效率低下、信息不对称、用户体验不佳等问题。具体研究目的如…...

Unity数字孪生项目上手第一步:别急着写代码,先搞定这5个核心组件(附快捷键秘籍)

Unity数字孪生项目上手第一步:别急着写代码,先搞定这5个核心组件(附快捷键秘籍) 刚接触Unity数字孪生开发的新手常犯一个错误——一上来就埋头写脚本。但真正高效的工作流,往往始于对基础组件的系统性搭建。就像建造房…...

在国产ARM服务器上,手把手教你离线搞定RabbitMQ 3.8.8和Erlang 22.1(含依赖包下载指南)

国产ARM服务器离线部署RabbitMQ 3.8.8全栈指南:从依赖包下载到集群配置 在信创产业快速推进的背景下,越来越多的企业开始将核心业务系统迁移到国产ARM架构服务器。当我在某金融客户的鲲鹏920服务器集群上首次实施RabbitMQ离线部署时,深刻体会…...

LiuJuan20260223Zimage代码生成实战:对比Claude Code与本地部署优势

LiuJuan20260223Zimage代码生成实战:对比Claude Code与本地部署优势 最近在尝试各种代码生成工具,从云端服务到本地部署的模型,都试了个遍。我发现很多开发者朋友在选择时都会纠结:是直接用Claude Code这样的云端服务方便&#x…...

基于Python的流浪猫狗救助救援网站毕业设计源码

博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在开发一个基于Python的流浪猫狗救助救援网站,以实现流浪动物救助工作的信息化、智能化和高效化。具体研究目的如下:提高流浪动物…...

Kimi-VL-A3B-Thinking入门必看:2.8B激活参数MoE多模态模型部署详解

Kimi-VL-A3B-Thinking入门必看:2.8B激活参数MoE多模态模型部署详解 1. 模型简介 Kimi-VL-A3B-Thinking是一款高效的开源混合专家(MoE)视觉语言模型,在多模态推理领域表现出色。这个模型最吸引人的特点是它仅激活2.8B参数就能实现…...

ComfyUI Manager终极指南:AI绘画插件管理的完整解决方案

ComfyUI Manager终极指南:AI绘画插件管理的完整解决方案 【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various cus…...

解锁NVIDIA隐藏潜能:用Profile Inspector打造专属游戏体验

解锁NVIDIA隐藏潜能:用Profile Inspector打造专属游戏体验 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 还在为游戏画面卡顿、撕裂而烦恼吗?是否觉得官方驱动控制面板的功能太…...

阿里万物识别镜像:中文图片识别快速部署与使用

阿里万物识别镜像:中文图片识别快速部署与使用 你有没有想过,如果电脑能像人一样“看懂”图片,会是什么样子?不是简单地识别“猫”或“狗”,而是能准确说出“这是一台华为MateBook笔记本电脑”、“那是一杯加了冰块的…...

告别接线混乱!用Fritzing可视化你的树莓派SSD1306 OLED连接图(SPI/I2C双模)

告别接线混乱!用Fritzing可视化你的树莓派SSD1306 OLED连接图(SPI/I2C双模) 当你第一次拿到SSD1306 OLED模块和树莓派时,面对密密麻麻的引脚和杜邦线,是否感到无从下手?文字教程虽然详细,但缺乏…...

s2-pro语音合成实操手册:上传参考音频复用音色的完整流程解析

s2-pro语音合成实操手册:上传参考音频复用音色的完整流程解析 1. 平台简介与核心功能 s2-pro是Fish Audio开源的专业级语音合成模型镜像,它提供了两大核心能力: 基础文本转语音:将输入的文本内容转换为自然流畅的语音音色克隆功…...

FlowState Lab赋能内容创作:自动生成小说情节发展曲线与角色情绪波动

FlowState Lab赋能内容创作:自动生成小说情节发展曲线与角色情绪波动 1. 引言:当AI遇见创意写作 你有没有遇到过这样的创作困境?写到第三章就卡壳,角色情绪转折生硬,故事节奏忽快忽慢。传统写作软件只能帮你检查语法…...

HUNYUAN-MT LaTeX科研文档翻译实践:完美保留公式与图表引用

HUNYUAN-MT LaTeX科研文档翻译实践:完美保留公式与图表引用 写论文、投期刊,对很多科研工作者来说,翻译是个绕不过去的坎。尤其是用LaTeX写的文档,里面塞满了复杂的公式、交叉引用和宏命令,直接扔给翻译工具&#xff…...

2026.4.12:编译openssl支持libcurl的https访问

编译openssl支持libcurl的https访问 环境:Ubuntu-26.04 需要的依赖:openssl 安装openssl https://github.com/openssl/openssl/releases wget https://github.com/openssl/openssl/releases/download/openssl-3.6.2/openssl-3.6.2.tar.gz tar -zxvf openssl-3.6.2.tar.gz./…...

效果惊艳!Anything to RealCharacters实战:多组2.5D/卡通图转真人效果对比展示

效果惊艳!Anything to RealCharacters实战:多组2.5D/卡通图转真人效果对比展示 1. 引言:当2.5D遇见写实魔法 想象一下,你精心绘制的2.5D角色突然拥有了真实的皮肤质感、自然的发丝细节和生动的表情——这就是Anything to RealCh…...

Java Swing文件分类系统开发全记录

个人文件分类管理系统设计与开发实录从零开始打造一个Java Swing桌面应用的全过程记录前言 作为一名Java学习者,在完成基础知识的学习后,我一直想动手做一个完整的小项目来巩固所学。刚好借Java课程设计要求完成一个项目的契机,经过反复思考&…...