当前位置: 首页 > article >正文

玩一玩微软的 bit 模型:BitNet. 一个 CPU 就能跑起来的大模型袄

一、 什么是 AI Skills从工具级到框架级的演化AI SkillsAI 技能 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初Skills 被视为“工具级”的增强如简单的文件读写或终端操作方便用户快速实现各种操作。然而在以 Solon AI 为代表的现代应用开发框架中AI Skills 已演化为一种更高维度的封装用于智能体应用开发。工具级Tool-level解决的是“手”的问题是具体的执行函数。框架级Framework-level解决的是“脑”的问题。它是工具Tools、指令Instruction与元数据Metadata的聚合体。它不仅包含执行逻辑还包含了准入检查、指令增强及工具染色能力。二、 AI Skills 应有的核心特性为了解决传统 Tool 模式下的上下文噪音、权限真空和行为失控一个成熟的 AI Skill 必须具备以下特质智能准入isSupported 只有满足特定意图、租户或环境条件时可称为提示词上下文技能才会被激活。避免无效工具对模型上下文的干扰和 Token 浪费。指令注入getInstruction 根据当前上下文为模型提供“行为准则”解决模型“该怎么做”的问题。工具路由getTools 根据当前上下文动态分发工具高度自治 技能内部闭环处理特定领域的逻辑对外部输出标准化的结果。三、 MCPAI 时代的万维网协议随着技能需求的爆发MCPModel Context Protocol模型上下文协议 应运而生。它是连接 AI 模型与外部数据/工具的标准协议。MCP 之于 AI正如 HTTP 之于万维网。在互联网时代HTTP 协议让任何浏览器都能访问任何服务器上的资源在 AI 时代MCP 协议让任何智能体都能无缝调用分布在不同物理位置、由不同厂商提供的技能。这种标准化彻底打破了“智能体”与“外部世界”之间的硬编码枷锁。四、 Tool 的分布式进化MCP Tool 的诞生Tool 的形态正在经历本质的变化从本地单体进化为 MCP Tool分布式 Tool。它具有物理位置透明性不再是内存中的一个函数而是一个个独立的分布式能力节点。这种“能力节点化”是 AI 走向微服务架构的第一步。传统 Tool 代码级耦合运行在 Agent 进程内部难以跨语言、跨环境复用。MCP Tool分布式 Tool 通过 MCP 协议暴露具有物理位置透明性。它不再是内存中的一个函数而是一个个独立的分布式能力节点。五、 架构映射从分布式的 MCP Tool 到 MCP SkillsTool 的分布式化为 AI Skills 的分布式化提供了自然的路径参考。当我们将一组具备业务逻辑、指令指导和工具集的 Skill 借助 MCP 协议进行发布时它便进化成了 MCP Skills。我们可以将 AI Agent 的分布式蓝图清晰地映射为传统架构MCP 相当于 RPC远程过程调用 它定义了模型与能力节点之间如何通信是智能体世界的底座管道。MCP Skills 相当于微服务Microservices 每个 Skill 就是一个独立的、具备业务语义的业务单元。题外之话Distributed AI Skills也可以借助传统 RPC 体系实现做的工作会更多些。六、 如何实现 MCP SkillsClient 与 Server 的协同实现 MCP Skills 的核心在于将 Skill 的生命周期语义映射到 MCP 协议的端点上。1. McpSkillClient远程技能的本地代理McpSkillClient 作为本地代理其职责是与远程服务握手并将网络调用包装成 Skill 接口。感知元数据通过约定路径同步远程元数据。动态映射在运行时将本地的 isSupported 或 getInstruction 调用转化为远程 MCP Tool 调用。工具过滤自动剔除标记为 hide 的管理类工具只给 LLM 呈现此时该看的业务工具。应用示例// 1. 构建 MCP 客户端提供者负责协议通信与 Schema 缓存McpClientProvider mcpClient McpClientProvider.builder().channel(McpChannel.STREAMABLE).url(http://localhost:8081/skill/order).build();// 2. 将 MCP 客户端进化为 Skill 代理McpSkillClient skillClient new McpSkillClient(mcpClient);// 3. 构建带有业务上下文的 PromptPrompt prompt Prompt.of(这个订单A001请查询订单详情。).attrPut(tenant_id, 1) // 注入租户上下文.attrPut(user_role, admin); // 注入角色权限// 4. 调用大模型技能将根据 Prompt 自动完成远程准入、指令获取、工具过滤chatModel.prompt(prompt).options(o - o.skillAdd(skillClient)).call();2. McpSkillServer具备感知的技能服务端通过继承 McpSkillServer开发者可以将本地业务逻辑导出为远程技能。生命周期暴露利用 ToolMapping 和 ResourceMapping 将 isSupported、getInstruction 等逻辑导出。智能感知服务端能通过传入的 Prompt 状态感知意图。例如根据角色权限决定 getToolsName 返回哪些工具。安全标记通过给管理端点添加 hide:1 标记确保系统级指令不会泄露给模型。应用示例McpServerEndpoint(channel McpChannel.STREAMABLE_STATELESS, mcpEndpoint /skill/order)public class OrderManagerSkillServer extends McpSkillServer {Overridepublic String description() {return 提供订单查询与取消的专业技能;}//智能准入根据 Prompt 内容与属性决定是否响应Overridepublic boolean isSupported(Prompt prompt) {// 语义检查意图是否相关boolean isOrderTask prompt.getUserContent().contains(订单);// 安全检查必须有租户 IDboolean hasTenant prompt.attr(tenant_id) ! null;return isOrderTask hasTenant;}//动态指令根据上下文为大模型注入实时“行为准则”Overridepublic String getInstruction(Prompt prompt) {String tenantName prompt.attrOrDefault(tenant_name, 未知租户);return 你现在是[ tenantName ]的订单主管。请只处理该租户下的订单数据禁止跨租户查询。;}//挂载钩子技能被激活时触发可用于注入初始化消息或记录日志Overridepublic void onAttach(Prompt prompt) {// 可以在此处通过 prompt.addMessage() 注入 Few-shot 或背景知识System.out.println(订单技能已挂载当前租户 prompt.attr(tenant_id));}/*** 动态能力发现根据用户权限决定暴露哪些工具* return null 表示暴露所有业务工具Empty 表示禁用所有工具List 表示精准暴露。*/Overridepublic List getToolsName(Prompt prompt) {List tools new ArrayList();// 基础权限所有合规用户可见tools.add(OrderQueryTool);// 细粒度权限仅 ADMIN 角色可见“取消订单”工具if (ADMIN.equals(prompt.attr(user_role))) {tools.add(OrderCancelTool);}return tools;}ToolMapping(description 根据订单号查询详情)public String OrderQueryTool(String orderId) {return 订单 orderId 状态已发货;}ToolMapping(description 取消指定订单)public String OrderCancelTool(String orderId) {return 订单 orderId 已成功取消;}}七、 必然性总结AI Skills 走分布式道路是不可逆转的解耦与复用 复杂技能如法律审计、专业代码重构不再需要在每个项目中重写而是作为服务独立存在。安全边界 敏感数据处理技能可以部署在专用的、受保护的内网环境中仅通过受控的 MCP 协议与公网 Agent 通信。异构生态 不同语言、不同算力环境下的能力都可以通过统一的 MCP 接口连接形成一个真正的“智能体微服务网络”。虐坦谥右

相关文章:

玩一玩微软的 bit 模型:BitNet. 一个 CPU 就能跑起来的大模型袄

一、 什么是 AI Skills:从工具级到框架级的演化 AI Skills(AI 技能) 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初,Skills 被视为“工具级”的增强,如简单的文件读写或终端操作,方便用户快速…...

VSCode插件Continue配置避坑指南:手把手教你无缝对接OpenStation的本地大模型服务

VSCode插件Continue配置避坑指南:手把手教你无缝对接OpenStation的本地大模型服务 当你已经成功部署了OpenStation的本地大模型服务,却在VSCode中配置Continue插件时遇到各种"拦路虎",这篇文章就是为你准备的调试手册。我们将深入每…...

别再用扁网线了!实测小米AX3600刷OpenWRT后断流的元凶排查与硬件避坑指南

深度解析OpenWRT网络断流:从硬件避坑到系统调优的全方位指南 当你兴冲冲地给路由器刷上OpenWRT,准备享受开源系统带来的自由与强大功能时,最令人抓狂的莫过于网络频繁断流。那种视频看到一半突然卡住、游戏关键时刻掉线的体验,足以…...

实战解析:基于Selenium与多线程的东方财富股吧数据采集方案

1. 为什么需要东方财富股吧数据采集 做量化分析的朋友都知道,市场情绪数据是alpha因子挖掘的重要来源。东方财富股吧作为国内活跃的股民社区,每天产生海量的讨论帖子和评论,这些数据对分析个股热度、投资者情绪变化具有重要价值。但手动收集这…...

在超大数据集下 DuckDB 与 MySQL 查询速度对比嵌

一、什么是urllib3? urllib3 是一个用于处理 HTTP 请求和连接池的强大、用户友好的 Python 库。 它可以帮助你: 发送各种 HTTP 请求(GET, POST, PUT, DELETE等)。 管理连接池,提高网络请求效率。 处理重试和重定向。 支…...

C# 面试高频题:装箱和拆箱是如何影响性能的?非

OCP原则 ocp指开闭原则,对扩展开放,对修改关闭。是七大原则中最基本的一个原则。 依赖倒置原则(DIP) 什么是依赖倒置原则 核心是面向接口编程、面向抽象编程, 不是面向具体编程。 依赖倒置原则的目的 降低耦合度&#…...

ChatterUI:突破移动端AI聊天限制,重构本地与云端智能对话体验

ChatterUI:突破移动端AI聊天限制,重构本地与云端智能对话体验 【免费下载链接】ChatterUI Simple frontend for LLMs built in react-native. 项目地址: https://gitcode.com/gh_mirrors/ch/ChatterUI ChatterUI是一款基于React Native构建的移动…...

响应式设计进阶技巧

响应式设计进阶技巧 1. 前言 在当今多设备时代,响应式设计已成为前端开发的标准实践。本文将深入探讨响应式设计的高级技巧,帮助你创建更加灵活、高效的响应式网站。 2. 响应式设计基础 2.1 核心概念 响应式设计的核心是根据设备屏幕尺寸和方向自动调整布…...

别再手动复制SSH公钥了,Linux服务器一键从GitHub快速导入公钥捕

一、项目背景与核心价值 1. 解决的核心痛点 Navicat的数据库连接密码并非明文存储,而是通过AES算法加密后写入.ncx格式的XML配置文件中。一旦用户忘记密码,常规方式只能重新配置连接,效率极低。本项目只作为学习研究使用,不做其他…...

【K8s】【笔记】----第七章:Kubernetes Service详解

【K8s】【笔记】----第一章:Kubernetes 介绍 【K8s】【笔记】----第二章:Kubernetes 集群环境搭建 【K8s】【笔记】----第三章:Kubernetes 资源管理 【K8s】【笔记】----第四章:Kubernetes 实战入门 【K8s】【笔记】----第五章&am…...

# 发散创新:基于Python实现轻量级物理引擎的核心算法与实战优化在游戏开发、虚拟仿真和机

发散创新:基于Python实现轻量级物理引擎的核心算法与实战优化 在游戏开发、虚拟仿真和机器人控制等领域,物理引擎是构建真实感交互体验的关键组件。本文将带你从零开始用 Python NumPy 实现一个简化但功能完整的 2D 物理引擎原型,并深入剖析…...

**Serverless架构下的无服务器框架实战:从零搭建高可用函数计算平台**

Serverless架构下的无服务器框架实战:从零搭建高可用函数计算平台 在现代云原生开发中,Serverless(无服务器)技术已成为构建弹性、低成本、高并发应用的核心选择之一。它彻底解耦了业务逻辑与底层基础设施管理,让开发者…...

AI原生不是口号,是生存——SITS2026系统改造的12项不可妥协技术红线(附银保监科技评估组密级评审意见节选)

第一章:AI原生不是口号,是生存——SITS2026系统改造的12项不可妥协技术红线(附银保监科技评估组密级评审意见节选) 2026奇点智能技术大会(https://ml-summit.org) 在SITS2026核心系统重构中,“AI原生”已非架构选型偏…...

自如”增益租3.0”模式:以真实案例解析,做值得信赖的资产托管方案

一、从真实案例出发:理解增益租模式的运作逻辑近期,网络上流传着一些关于自如“增益租3.0”模式的案例讨论。其中,有业主反馈将毛坯房委托后,因选择分期支付装修费用,导致前期每月到手租金较低,且短期内未获…...

OpenClaw健康监控:Qwen3.5-9B预警系统异常

OpenClaw健康监控:Qwen3.5-9B预警系统异常 1. 为什么需要AI健康监控系统 上周我的开发机突然死机,导致一个正在运行的OpenClaw自动化任务中断。检查日志发现是内存泄漏导致系统崩溃,但此时损失已经造成。这次经历让我意识到:当A…...

HagiCode Desktop 混合分发架构解析:如何用 PP 加速大文件下载成

一、Actor 模型:不是并发技巧,而是领域单元 Actor 模型的本质是: Actor 是独立运行的实体 Actor 之间只通过消息交互 Actor 内部状态不可被外部直接访问 Actor 自行决定如何处理收到的消息 Actor 模型真正解决的是: 如何在不共享状…...

nnUNet环境配置避坑指南:从PyTorch安装到数据集转换的完整流程

nnUNet环境配置与实战指南:从零搭建医学图像分割流水线 1. 环境部署:构建稳定高效的PyTorch基础 在开始nnUNet之旅前,确保拥有兼容的硬件环境:推荐使用NVIDIA显卡(RTX 3060及以上)、16GB以上内存和至少100G…...

Python数据可视化指南

Python数据可视化指南 后端转 Rust 的萌新,ID "第一程序员"——名字大,人很菜(暂时)。正在跟所有权和生命周期死磕,日常记录 Rust 学习路上的踩坑经验和"啊哈时刻",代码片段保证能跑。…...

__block 变量内存布局详解恫

故障表现 发现请求集群 demo 入口时卡住,并且对应 Pod 没有新的日志输出 rootce-demo-1:~# kubectl get pods -n deepflow-otel-spring-demo -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NO…...

告别Dummy Output!Ubuntu 22.04声音与蓝牙问题一站式修复指南(PipeWire/PulseAudio实战)

Ubuntu 22.04音频与蓝牙问题终极解决方案:从诊断到修复全流程 当你兴奋地打开Ubuntu 22.04准备享受音乐或进行视频会议时,"Dummy Output"这个令人沮丧的提示突然出现,或者蓝牙耳机频繁断连——这种体验确实令人抓狂。作为长期使用L…...

5款降重降AI工具实测 2026毕业季首选SpeedAI科研小助手

2026年毕业季临近,知网、维普、Turnitin等主流学术检测平台的AIGC检测算法已完成新一轮迭代升级,论文AI生成率不再是无关紧要的附加指标,而是直接影响审核通过、答辩资格的核心门槛。教育部对学术成果中AI使用的规范要求不断收紧,…...

避开风控!影刀RPA抓取小红书评论的保姆级配置指南(含60秒间隔、Excel文本格式设置)

影刀RPA小红书评论采集实战:高稳定性配置与风控规避手册 第一次用影刀RPA抓取小红书评论时,我连续被封了三个账号——因为没意识到平台对高频请求的敏感度。后来通过反复测试发现,间隔时间设置差5秒就可能触发完全不同的风控等级。这份指南将…...

我不是狐狸,我是那Harness Engineering律

Julia(julialang.org)由Stefan Karpinski、Jeff Bezanson等在2009年创建,目标是融合Python的易用性、C的高性能、R的统计能力、Matlab的科学计算生态。 其核心设计哲学是: 高性能:编译型语言(JIT&#xff0…...

lwIP 深度解析:TCP 错误回调函数 errf 的触发机制与实战应用

1. lwIP协议栈中的TCP错误处理机制 在嵌入式网络开发中,lwIP作为轻量级TCP/IP协议栈被广泛应用。理解其TCP错误处理机制对开发稳定可靠的网络应用至关重要。TCP协议通过错误回调函数(errf)向应用层报告连接异常,这就像是一个贴心的…...

PyCharm 2023最新汉化指南:一键切换中文开发环境

1. PyCharm 2023中文界面一键配置指南 刚接触Python开发的朋友们,第一次打开PyCharm可能会被满屏的英文吓到。别担心,JetBrains早就考虑到了这个问题,从2020版开始就提供了官方中文语言包。2023年的最新版本更是优化了汉化体验,整…...

如果给你10亿条id数据让你去重,你会怎么做?

如果给你10亿条id数据让你去重,你会怎么做? 最近在刷一些其他题库的题,发现遇到一些类似的问题甚至是相同的题还是会卡住,我觉得我需要转变一下思路,总结一下一类题的算法,而不是每天写一道题的解题思路&am…...

算法可视化神器!用动画让冒泡排序、二分查找一目了然

还在为理解冒泡排序的每一趟交换,或是二分查找的边界条件而绞尽脑汁吗?静态的代码和文字描述有时确实不够直观。 想要真正让算法“动”起来,一目了然?强烈推荐你试试**图码这个专注于算法可视化**的神器。 它提供了超过60种数据…...

Redis持久化:从AOF到RDB,如何实现数据不丢失?谑

Qt是一个跨平台C图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本笔记将重点介绍QSpinBox数值微调组件的常用方法及灵活应用。…...

AspNet MVC4 教学:AspNet MVC4 页面动态生成演示

HomeControllers.cs文件内容:using System; using System.Collections.Generic; using System.Linq; using System.Web; using System.Web.Mvc;namespace MvcDynamicPage.Controllers {public class HomeController : Controller{//// GET: /Home/public ActionResult Index(){…...

打字不如说话,说话不如截图——AI 代码助手的多模态输入实践仝

整体排查思路 我们的目标是验证以下三个环节是否正常: 登录成功时:服务器是否正确生成了Session并返回了包含正确 JSESSIONID的Cookie给浏览器。 浏览器端:浏览器是否成功接收并存储了该Cookie。 后续请求:浏览器在执行查询等操作…...