当前位置: 首页 > article >正文

玩一玩微软的 bit 模型:BitNet. 一个 CPU 就能跑起来的大模型谀

一、 什么是 AI Skills从工具级到框架级的演化AI SkillsAI 技能 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初Skills 被视为“工具级”的增强如简单的文件读写或终端操作方便用户快速实现各种操作。然而在以 Solon AI 为代表的现代应用开发框架中AI Skills 已演化为一种更高维度的封装用于智能体应用开发。工具级Tool-level解决的是“手”的问题是具体的执行函数。框架级Framework-level解决的是“脑”的问题。它是工具Tools、指令Instruction与元数据Metadata的聚合体。它不仅包含执行逻辑还包含了准入检查、指令增强及工具染色能力。二、 AI Skills 应有的核心特性为了解决传统 Tool 模式下的上下文噪音、权限真空和行为失控一个成熟的 AI Skill 必须具备以下特质智能准入isSupported 只有满足特定意图、租户或环境条件时可称为提示词上下文技能才会被激活。避免无效工具对模型上下文的干扰和 Token 浪费。指令注入getInstruction 根据当前上下文为模型提供“行为准则”解决模型“该怎么做”的问题。工具路由getTools 根据当前上下文动态分发工具高度自治 技能内部闭环处理特定领域的逻辑对外部输出标准化的结果。三、 MCPAI 时代的万维网协议随着技能需求的爆发MCPModel Context Protocol模型上下文协议 应运而生。它是连接 AI 模型与外部数据/工具的标准协议。MCP 之于 AI正如 HTTP 之于万维网。在互联网时代HTTP 协议让任何浏览器都能访问任何服务器上的资源在 AI 时代MCP 协议让任何智能体都能无缝调用分布在不同物理位置、由不同厂商提供的技能。这种标准化彻底打破了“智能体”与“外部世界”之间的硬编码枷锁。四、 Tool 的分布式进化MCP Tool 的诞生Tool 的形态正在经历本质的变化从本地单体进化为 MCP Tool分布式 Tool。它具有物理位置透明性不再是内存中的一个函数而是一个个独立的分布式能力节点。这种“能力节点化”是 AI 走向微服务架构的第一步。传统 Tool 代码级耦合运行在 Agent 进程内部难以跨语言、跨环境复用。MCP Tool分布式 Tool 通过 MCP 协议暴露具有物理位置透明性。它不再是内存中的一个函数而是一个个独立的分布式能力节点。五、 架构映射从分布式的 MCP Tool 到 MCP SkillsTool 的分布式化为 AI Skills 的分布式化提供了自然的路径参考。当我们将一组具备业务逻辑、指令指导和工具集的 Skill 借助 MCP 协议进行发布时它便进化成了 MCP Skills。我们可以将 AI Agent 的分布式蓝图清晰地映射为传统架构MCP 相当于 RPC远程过程调用 它定义了模型与能力节点之间如何通信是智能体世界的底座管道。MCP Skills 相当于微服务Microservices 每个 Skill 就是一个独立的、具备业务语义的业务单元。题外之话Distributed AI Skills也可以借助传统 RPC 体系实现做的工作会更多些。六、 如何实现 MCP SkillsClient 与 Server 的协同实现 MCP Skills 的核心在于将 Skill 的生命周期语义映射到 MCP 协议的端点上。1. McpSkillClient远程技能的本地代理McpSkillClient 作为本地代理其职责是与远程服务握手并将网络调用包装成 Skill 接口。感知元数据通过约定路径同步远程元数据。动态映射在运行时将本地的 isSupported 或 getInstruction 调用转化为远程 MCP Tool 调用。工具过滤自动剔除标记为 hide 的管理类工具只给 LLM 呈现此时该看的业务工具。应用示例// 1. 构建 MCP 客户端提供者负责协议通信与 Schema 缓存McpClientProvider mcpClient McpClientProvider.builder().channel(McpChannel.STREAMABLE).url(http://localhost:8081/skill/order).build();// 2. 将 MCP 客户端进化为 Skill 代理McpSkillClient skillClient new McpSkillClient(mcpClient);// 3. 构建带有业务上下文的 PromptPrompt prompt Prompt.of(这个订单A001请查询订单详情。).attrPut(tenant_id, 1) // 注入租户上下文.attrPut(user_role, admin); // 注入角色权限// 4. 调用大模型技能将根据 Prompt 自动完成远程准入、指令获取、工具过滤chatModel.prompt(prompt).options(o - o.skillAdd(skillClient)).call();2. McpSkillServer具备感知的技能服务端通过继承 McpSkillServer开发者可以将本地业务逻辑导出为远程技能。生命周期暴露利用 ToolMapping 和 ResourceMapping 将 isSupported、getInstruction 等逻辑导出。智能感知服务端能通过传入的 Prompt 状态感知意图。例如根据角色权限决定 getToolsName 返回哪些工具。安全标记通过给管理端点添加 hide:1 标记确保系统级指令不会泄露给模型。应用示例McpServerEndpoint(channel McpChannel.STREAMABLE_STATELESS, mcpEndpoint /skill/order)public class OrderManagerSkillServer extends McpSkillServer {Overridepublic String description() {return 提供订单查询与取消的专业技能;}//智能准入根据 Prompt 内容与属性决定是否响应Overridepublic boolean isSupported(Prompt prompt) {// 语义检查意图是否相关boolean isOrderTask prompt.getUserContent().contains(订单);// 安全检查必须有租户 IDboolean hasTenant prompt.attr(tenant_id) ! null;return isOrderTask hasTenant;}//动态指令根据上下文为大模型注入实时“行为准则”Overridepublic String getInstruction(Prompt prompt) {String tenantName prompt.attrOrDefault(tenant_name, 未知租户);return 你现在是[ tenantName ]的订单主管。请只处理该租户下的订单数据禁止跨租户查询。;}//挂载钩子技能被激活时触发可用于注入初始化消息或记录日志Overridepublic void onAttach(Prompt prompt) {// 可以在此处通过 prompt.addMessage() 注入 Few-shot 或背景知识System.out.println(订单技能已挂载当前租户 prompt.attr(tenant_id));}/*** 动态能力发现根据用户权限决定暴露哪些工具* return null 表示暴露所有业务工具Empty 表示禁用所有工具List 表示精准暴露。*/Overridepublic List getToolsName(Prompt prompt) {List tools new ArrayList();// 基础权限所有合规用户可见tools.add(OrderQueryTool);// 细粒度权限仅 ADMIN 角色可见“取消订单”工具if (ADMIN.equals(prompt.attr(user_role))) {tools.add(OrderCancelTool);}return tools;}ToolMapping(description 根据订单号查询详情)public String OrderQueryTool(String orderId) {return 订单 orderId 状态已发货;}ToolMapping(description 取消指定订单)public String OrderCancelTool(String orderId) {return 订单 orderId 已成功取消;}}七、 必然性总结AI Skills 走分布式道路是不可逆转的解耦与复用 复杂技能如法律审计、专业代码重构不再需要在每个项目中重写而是作为服务独立存在。安全边界 敏感数据处理技能可以部署在专用的、受保护的内网环境中仅通过受控的 MCP 协议与公网 Agent 通信。异构生态 不同语言、不同算力环境下的能力都可以通过统一的 MCP 接口连接形成一个真正的“智能体微服务网络”。普赜牡死

相关文章:

玩一玩微软的 bit 模型:BitNet. 一个 CPU 就能跑起来的大模型谀

一、 什么是 AI Skills:从工具级到框架级的演化 AI Skills(AI 技能) 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初,Skills 被视为“工具级”的增强,如简单的文件读写或终端操作,方便用户快速…...

当大模型把“张一鸣”识别成地名、“Transformer”标为人物——奇点大会NER鲁棒性红蓝对抗测试全记录(含137个对抗样本集)

第一章:2026奇点智能技术大会:大模型命名实体识别 2026奇点智能技术大会(https://ml-summit.org) 大模型NER的范式演进 传统基于BiLSTM-CRF的命名实体识别方法在2026年已全面让位于大语言模型驱动的上下文感知NER架构。本届大会展示的核心突破在于&…...

MiniMax M. 发布!Redis 故障排查 + 跨语言重构场景实测,表现如何?焉

一、前言:什么是 OFA VQA 模型? OFA(One For All)是字节跳动提出的多模态预训练模型,支持视觉问答、图像描述、图像编辑等多种任务,其中视觉问答(VQA)是最常用的功能之一——输入一…...

仅限头部AI平台内部流出的配额审计清单:覆盖Token级计量、跨模型共享配额、突发流量信用额度等8项稀缺机制

第一章:大模型工程化限流与配额管理 2026奇点智能技术大会(https://ml-summit.org) 在大规模语言模型服务化落地过程中,限流与配额管理是保障系统稳定性、公平性与商业可持续性的核心工程能力。当数百个业务方共享同一套推理集群时,突发流量…...

Python——排序

排序一、sorted() 函数(推荐)对字典列表排序(工作超常用)二、list.sort()三、手写快速排序四、高级用法:按指定条件排序1. 按字符串长度2. 按数字绝对值3. 按对象/字典某个字段(接口/测试数据常用&#xff…...

Excel导出避坑指南:Vue项目中xlsx库的6个常见问题及解决方案

Vue项目中Excel导出实战:破解xlsx库的6大高频难题 在Vue项目开发中,数据导出为Excel文件是常见的业务需求,而xlsx库作为前端处理Excel的利器,其使用过程中却暗藏诸多"坑点"。本文将聚焦开发者在真实项目中遇到的6个典型…...

实测对比:CST仿真3.5GHz波导魔T的5种边界条件设置方案

实测对比:CST仿真3.5GHz波导魔T的5种边界条件设置方案 在射频工程领域,波导魔T作为关键的无源器件,其性能直接影响整个系统的信号质量。特别是在5G基站滤波器等应用中,3.4-4GHz频段的特性控制尤为关键。本文将深入探讨五种不同边界…...

Jasmine漫画浏览器终极指南:打造跨设备无缝阅读体验的完整教程

Jasmine漫画浏览器终极指南:打造跨设备无缝阅读体验的完整教程 【免费下载链接】jasmine A comic browser,support Android / iOS / MacOS / Windows / Linux. 项目地址: https://gitcode.com/gh_mirrors/jas/jasmine Jasmine漫画浏览器是一款革…...

HY-Motion 1.0一键部署:云服务器(阿里云/AWS)3分钟上线Web服务

HY-Motion 1.0一键部署:云服务器(阿里云/AWS)3分钟上线Web服务 1. 概述:从文字到动画的魔法转换 想象一下,你只需要输入"一个人在跳舞",电脑就能自动生成一个逼真的3D舞蹈动画。这不是科幻电影…...

CompressO终极指南:免费开源视频压缩神器,一键释放95%存储空间

CompressO终极指南:免费开源视频压缩神器,一键释放95%存储空间 【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mir…...

Pharma NLP:药品命名实体识别的代码工程实践

“把这几十万份 ADR(不良反应)报告里的药品名、不良事件、剂量信息都提取出来?现在全靠人工,一个人一天顶多 80 份,三年的报告积压在那儿了。” 药品 NER 跟你在 CoNLL-2003 上跑的那个 NER,不是一个物种。 通用 NER 里,"苹果"要么是水果要么是公司,上下文清…...

扫地机器人,大厂扫地机器人 源代码,freertos实时操作系统,企业级应用源码

扫地机器人,大厂扫地机器人 源代码,freertos实时操作系统,企业级应用源码,适合需要学习嵌入式以及实时操作系统的工程师,32端代码能实现延边避障防跌 落充电等功能。 硬件驱动包含 陀螺仪姿态传感器bmi160、电源管理bq…...

Pi0机器人控制中心边缘计算效果展示:低延迟实时控制演示

Pi0机器人控制中心边缘计算效果展示:低延迟实时控制演示 1. 引言 想象一下,一个机器人能够像人类一样快速响应指令,几乎感觉不到任何延迟——你让它抬手,它瞬间抬手;你让它转向,它立即转向。这种流畅的实…...

gte-base-zh语义去重方案:千万级UGC内容基于gte-base-zh的高效重复检测

gte-base-zh语义去重方案:千万级UGC内容基于gte-base-zh的高效重复检测 1. 引言:当内容泛滥遇上重复难题 你有没有遇到过这样的场景?每天打开内容平台,推送的文章、视频、帖子看起来都差不多,好像总在重复。作为平台…...

EtherLab IGH1.6.5新版本发布:7年等待后的全面升级

1. 七年磨一剑:EtherLab IGH1.6.5的诞生背景 2017年10月发布的EtherLab IGH1.5.2版本,曾经是工业自动化领域的一个重要里程碑。这个开源EtherCAT主站解决方案,凭借其稳定性和灵活性,在机器人控制、数控机床、自动化生产线等场景中…...

影子货币:商家跑路,储值卡变成废纸

中国影子货币全图谱 目录 中国影子货币全图谱 一、第一类:银行表外影子货币(规模最大,约50万亿元) 1. 银行现金管理类理财产品(规模约18万亿元) 2. 银行非保本理财产品(规模约22万亿元) 3. 银行同业存单与同业理财(规模约10万亿元) 二、第二类:非银金融机构影子货币…...

Vue项目实战:基于Element-UI的El-Select-Tree树形下拉选择器封装指南

1. 为什么需要封装El-Select-Tree组件 在实际开发中,我们经常会遇到需要选择树形结构数据的场景。比如选择部门、分类目录或者地区信息时,传统的下拉选择器无法直观展示层级关系。Element-UI虽然提供了el-select和el-tree两个独立组件,但原生…...

H5年会抽奖实战:手机号与微信头像双模式实现

1. 为什么选择H5实现年会抽奖 每到年底,企业年会就成了大家最期待的活动之一。作为技术人,我们总想用些新花样让抽奖环节更有趣。去年我负责公司年会抽奖系统开发时,就遇到了一个典型需求:既要支持传统的手机号抽奖,又…...

ESP8266 OTA升级实战:基于巴法云的极简实现方案

1. ESP8266 OTA升级入门:为什么选择巴法云? 每次给ESP8266设备更新固件都要插USB线?太麻烦了!OTA(Over-The-Air)无线升级技术能让你像手机更新APP一样轻松升级设备固件。而巴法云平台的出现,把原…...

ESP居然能当 DNS 服务器用?内含NCSI欺骗和DNS劫持实现蓝

前言 Kubernetes 本身并不复杂,是我们把它搞复杂的。无论是刻意为之还是那种虽然出于好意却将优雅的原语堆砌成 鲁布戈德堡机械 的狂热。平台最初提供的 ReplicaSets、Services、ConfigMaps,这些基础组件简单直接,甚至显得有些枯燥。但后来我…...

STM32定时器外部计数模式实战:高精度频率计设计与优化

1. 为什么选择外部计数模式做频率计 在嵌入式开发中,测量信号频率是个常见需求。我最初尝试用外部中断方式实现,发现当信号频率超过100kHz时,CPU中断响应就跟不上了。后来改用输入捕获模式,虽然精度提升到0.5%,但测量范…...

Codex使用教程:在PyTorch项目开发中借助AI编程助手提升效率

Codex使用教程:在PyTorch项目开发中借助AI编程助手提升效率 1. 为什么PyTorch开发者需要AI编程助手 如果你经常用PyTorch做深度学习开发,肯定遇到过这些情况:写数据加载器时总得翻文档查参数,模型定义部分重复写相似的层结构&am…...

libcrypt-dev安装指南:解决crypt.h缺失报错

1. 当你的代码突然喊"找不到crypt.h"时 第一次在Linux环境下编译加密相关的代码时,看到终端里跳出"crypt.h: No such file or directory"的红色报错,我差点把咖啡喷在键盘上。这个场景太常见了——你从GitHub克隆了个看起来很酷的开…...

Python爬虫实战:逆向解析央视频加密参数(附完整代码)

Python逆向工程实战:解密央视频加密体系的技术探索 在当今数字媒体蓬勃发展的时代,视频平台的内容保护机制日益复杂。作为开发者,理解这些保护机制不仅有助于合规获取公开数据,更能深入掌握现代Web应用的安全设计思路。本文将带您…...

Xinference-v1.17.1在计算机网络实验教学中的应用

Xinference-v1.17.1在计算机网络实验教学中的应用 1. 引言 计算机网络实验教学一直面临着设备成本高、实验环境复杂、协议分析困难等挑战。传统的实验方式需要学生手动配置网络设备、抓包分析协议,整个过程耗时耗力且容易出错。Xinference-v1.17.1的出现为计算机网…...

无需专业显卡!Qwen3-VL-4B Pro在普通电脑上的部署指南

无需专业显卡!Qwen3-VL-4B Pro在普通电脑上的部署指南 1. 从“看着眼馋”到“真正能用”:一个普通人的多模态AI体验 你有没有过这样的经历? 看到别人展示AI看图说话、识别表格、分析图表,觉得特别酷,自己也想试试。…...

FLUX.小红书极致真实V2工作台整合:与Notion/飞书/小红书后台联动

FLUX.小红书极致真实V2工作台整合:与Notion/飞书/小红书后台联动 1. 项目简介 你是否曾经遇到过这样的困扰:想要生成小红书风格的高质量图片,但要么需要昂贵的云端服务,要么本地部署的模型显存占用太大,普通显卡根本…...

StructBERT-中文-large部署指南:开源镜像免配置运行详解

StructBERT-中文-large部署指南:开源镜像免配置运行详解 1. 快速了解StructBERT文本相似度模型 StructBERT中文文本相似度模型是一个专门用于中文文本相似度计算的高性能模型。这个模型基于structbert-large-chinese预训练模型,经过大规模中文相似度数…...

深入解析ABB AC500与西门子S7-300的Profibus-DP通讯配置与优化

1. Profibus-DP通讯基础与硬件准备 在工业自动化领域,不同品牌PLC之间的通讯一直是工程师们需要面对的挑战。ABB AC500和西门子S7-300作为两大主流控制器,通过Profibus-DP实现数据交换是常见需求。Profibus-DP采用主从架构,最高传输速率可达1…...

ResMLP、gMLP怎么选?深入对比三大纯MLP视觉模型的优缺点与落地场景

ResMLP、gMLP与MLP-Mixer技术选型指南:三大纯MLP视觉模型实战对比 当计算机视觉领域还在为Transformer和CNN争论不休时,一匹黑马正悄然改变游戏规则——纯MLP架构。不同于传统认知,MLP-Mixer、ResMLP和gMLP这些仅由多层感知机构建的模型&…...