当前位置: 首页 > article >正文

PhonePi MCP:基于MCP协议实现AI助手远程控制手机的完整指南

1. 项目概述将你的手机变成AI助手的智能工具箱如果你和我一样日常工作中重度依赖像Cursor、Claude Desktop这类AI编程助手那你肯定遇到过这样的场景正在电脑前专注写代码手机突然在另一个房间响了或者想快速给同事发条短信确认个事情却不得不放下手头的工作去拿手机。又或者你希望AI助手能帮你管理手机上的日程、联系人实现更深度的自动化。过去这些需求往往需要依赖复杂的自动化脚本或者特定的商业软件直到我遇到了PhonePi MCP这个项目。简单来说PhonePi MCP是一个基于Model Context Protocol的开源服务器和配套手机应用。它的核心目标是让你能通过自然语言直接在你常用的AI应用里远程控制和管理你的手机。你可以把它理解为一个“桥梁”一端连着运行在你电脑上的AI助手通过MCP协议另一端连着你的手机通过本地网络上的配套App。当你对AI助手说“给我的手机设一个10分钟后的闹钟”或者“把刚刚讨论的联系人张三保存到手机通讯录”时AI助手就能通过这个桥梁将你的指令转化为手机上的实际操作。这个项目的价值在于它把手机从一个需要你手动交互的独立设备变成了AI工作流中一个可编程、可查询、可控制的智能节点。对于开发者、效率追求者或者任何希望将AI能力与移动设备深度整合的人来说这无疑打开了一扇新的大门。接下来我将结合我的实际部署和使用经验为你详细拆解这个项目的设计思路、核心功能、具体的搭建步骤以及那些官方文档里可能没写的“坑”和技巧。2. 核心设计思路与技术选型解析2.1 为什么是MCP要理解PhonePi MCP首先要理解它依赖的基石Model Context Protocol。MCP是Anthropic提出的一种开放协议旨在为AI模型如Claude提供一个标准化的方式来发现、调用外部工具和访问动态数据。你可以把它想象成AI世界的“USB标准”或“插件接口规范”。在PhonePi MCP出现之前如果你想用AI控制手机通常有几种路径特定App的API比如通过IFTTT、Shortcuts苹果快捷指令触发一些预设操作但灵活性和自然语言交互能力有限。自动化框架如Android的Tasker或iOS的快捷指令自动化需要复杂的规则配置难以与桌面AI自然对话。商业远程控制软件功能强大但通常闭源存在隐私顾虑且不一定提供编程接口。PhonePi MCP选择了MCP我认为是出于几个关键考量生态兼容性直接对接了正在快速增长的MCP生态。只要你的AI客户端如Cursor、Claude Desktop支持MCP你就能无缝使用PhonePi提供的所有工具无需为每个客户端单独开发适配。协议标准化MCP定义了标准的工具Tools、资源Resources和数据源Data Sources模型。PhonePi MCP只需要遵循这套模型暴露手机的能力如“发送短信”、“读取联系人”任何兼容MCP的客户端都能理解并使用这些能力。自然语言优先MCP的设计初衷就是让AI模型能理解工具的功能描述通过Schema从而让用户可以用最自然的语言下达指令。例如AI模型看到工具send_sms的描述是“向指定电话号码发送短信”它就能在对话中主动建议或直接执行这个操作。2.2 架构拆解客户端、服务器与手机App如何协同PhonePi MCP的架构清晰分为三部分理解这三者的关系是顺利部署的关键。1. MCP客户端这是你日常使用的AI应用例如Cursor编辑器或Claude Desktop。它们需要配置支持MCP协议。以Cursor为例你需要在它的设置中指定MCP服务器的地址。当你在Cursor中与AI对话时Cursor作为MCP客户端会与配置的MCP服务器建立连接查询服务器提供了哪些工具并在对话中适时地提供这些工具给你使用。2. MCP服务器这是PhonePi MCP项目的核心一个运行在你电脑或某个你控制的服务器上的后台程序。它的职责是实现MCP协议与客户端通信。封装了对手机进行操作的所有逻辑API。通过本地网络与手机上的配套App进行安全通信。将客户端的请求如“发送短信”转发给手机App执行并将结果返回给客户端。3. 手机配套App这是安装在你的Android或iOS手机上的应用程序。它负责接收来自MCP服务器的指令并在手机上执行具体的操作如真正地发送短信、读取通讯录、调整设置等。它需要向用户申请相应的系统权限如短信、联系人、通知访问权限。通信流程可以简化为你的自然语言指令 - AI客户端Cursor - MCP服务器你的电脑 - 手机App你的手机 - 执行并返回结果。整个数据流都在你的本地网络内完成这是其强调安全性的基础。注意这里有一个常见的理解误区。MCP服务器PhonePi MCP服务端是运行在你的电脑上而不是手机上。手机上的只是一个接收指令的“执行器”App。所以你的电脑和手机需要在同一个局域网内或者通过安全的虚拟网络如Tailscale连接。2.3 安全模型与隐私考量作者在文档中将安全列为高度关注点这是非常负责任的。我们来深入分析一下它的安全设计本地化与开源整个方案的核心是本地部署。MCP服务器代码开源你可以自行审查通信发生在你的设备之间不经过任何第三方服务器。这从根本上避免了云服务可能带来的数据泄露风险。权限最小化手机App会明确向你申请它需要的权限如短信、联系人、通知。你可以根据自己计划使用的功能选择性地授予权限。例如如果你只用它来查找手机或控制媒体播放就完全不需要授予短信或联系人权限。网络隔离依赖本地网络Wi-Fi通信。这意味着攻击者需要先侵入你的本地网络才能尝试拦截通信。因此作者强烈建议不要在公共Wi-Fi如机场、咖啡馆下使用此功能。虚拟专用网络推荐对于需要在外网访问的场景比如公司电脑控制家里的手机作者推荐使用Tailscale这类基于WireGuard的零配置VPN工具。Tailscale会在你的所有设备间建立一个加密的虚拟局域网即使它们物理上不在同一个地方也能像在同一个局域网内一样安全通信。这比暴露端口到公网要安全得多。实操心得在实际使用中我强烈建议即使在家也考虑使用Tailscale。原因有二第一它提供了比普通家用路由器更稳定和加密的通道第二当你需要移动办公时例如用笔记本电脑在咖啡馆连接家里的手机Tailscale能提供一个统一、安全的方式无需反复修改网络配置。3. 环境准备与详细部署指南纸上得来终觉浅绝知此事要躬行。下面我将以在macOS/Linux系统上部署为例带你一步步走通整个流程。Windows系统除了包管理工具不同可使用WSL或直接下载二进制文件核心步骤是相似的。3.1 前期准备清单在开始敲命令之前请确保准备好以下三样东西一台电脑用作运行MCP服务器。系统可以是macOS、Linux或Windows建议使用WSL2以获得最佳体验。一部智能手机Android或iOS均可。PhonePi MCP对两者都有支持。一个可控制的局域网环境确保你的电脑和手机连接在同一个Wi-Fi网络下。这是最简单直接的通信方式。3.2 步骤一在电脑上部署MCP服务器这是最核心的一步。官方推荐使用uv这个快速的Python包安装器它比传统的pip能更好地处理依赖隔离。1. 安装uv打开你的终端执行以下命令。uv是一个用Rust写的工具安装速度极快。curl -LsSf https://astral.sh/uv/install.sh | sh安装完成后关闭并重新打开终端或者运行source ~/.bashrc或source ~/.zshrc使uv命令生效。可以通过uv --version验证安装。2. 克隆项目并安装依赖找一个你喜欢的目录克隆PhonePi MCP的仓库。git clone https://github.com/priyankark/phonepi-mcp.git cd phonepi-mcp使用uv创建虚拟环境并安装所有依赖。uv会自动处理Python版本和依赖锁定。uv sync这个命令会读取pyproject.toml文件创建一个独立的虚拟环境通常在.venv目录下并安装所有必要的包。3. 配置环境变量PhonePi MCP服务器需要一些配置信息才能运行比如监听端口、允许连接的客户端地址等。最简单的方式是创建一个.env文件。cp .env.example .env然后用文本编辑器打开.env文件进行基本配置。以下是最关键的几个参数# .env 文件示例 MCP_HOST0.0.0.0 # 监听所有网络接口 MCP_PORT8000 # 服务器运行端口可自定义 ALLOWED_ORIGINShttp://localhost:3000,http://127.0.0.1:3000 # 允许连接的客户端地址对于Cursor/Claude Desktop本地地址即可 # 日志级别调试时可设为DEBUG LOG_LEVELINFOMCP_HOST0.0.0.0意味着服务器接受来自任何网络接口的连接包括本地回环和你的局域网IP这对于手机App连接是必须的。4. 运行MCP服务器在项目根目录下使用uv run来启动服务器。uv run python -m phonepi_mcp.server如果一切顺利你将在终端看到类似下面的输出表明服务器已在指定端口启动INFO: Started server process [12345] INFO: Waiting for application startup. INFO: Application startup complete. INFO: Uvicorn running on http://0.0.0.0:8000 (Press CTRLC to quit)请保持这个终端窗口运行不要关闭它。注意事项第一次运行时你可能会遇到防火墙提示尤其是在macOS或Windows上。请务必允许Python或你的终端应用接受传入连接。否则手机App将无法连接到电脑上的服务器。3.3 步骤二在手机上安装并配置配套App接下来我们需要在手机上安装“执行器”。获取App访问项目的官方文档网站 phonepimcp.com 通常会有直接下载APKAndroid或TestFlight链接iOS的指引。由于项目可能处于活跃开发中请以官方文档为准。安装与权限安装完成后打开App。它会首先请求必要的权限。请根据你计划使用的功能谨慎授予。例如必选基础连接本地网络权限用于发现电脑。按需选择联系人用于管理通讯录、短信用于收发、通知访问用于读取和回复通知、位置用于查找手机等。连接服务器这是关键一步。App通常会提供两种连接方式自动发现如果电脑和手机在同一个局域网App可能会自动扫描并列出可用的MCP服务器。点击你的电脑名或IP地址即可连接。手动输入如果自动发现失败你需要手动输入。回到你的电脑终端查看服务器的IP地址。在macOS/Linux上可以运行ifconfig | grep inet 在Windows上运行ipconfig找到你的电脑在局域网中的IP地址通常是192.168.x.x或10.x.x.x。然后在手机App的地址栏输入http://你的电脑IP:8000端口号与.env中设置的MCP_PORT一致。连接成功后手机App界面通常会显示“已连接”或类似的提示。3.4 步骤三配置你的AI客户端以Cursor为例现在桥梁的两端服务器和手机已经搭好我们需要配置AI客户端来使用这座桥。打开Cursor编辑器。进入Cursor的设置。通常在左下角找到设置图标或者通过命令面板Cmd/Ctrl Shift P搜索“Settings”。在设置中找到“MCP Servers”或“Model Context Protocol”相关的配置部分。点击“Add New Server”或类似按钮。在配置中你需要指定MCP服务器的地址。由于Cursor和MCP服务器都运行在你的电脑上这里使用本地回环地址即可。配置如下Name: 给你这个服务器起个名字例如 “My Phone”。URL: 输入http://127.0.0.1:8000这里的端口号必须与你启动服务器时使用的MCP_PORT一致。Type: 通常选择 “HTTP” 或 “Stdio”这里我们配置的是HTTP服务器所以选HTTP。保存配置后Cursor可能会提示需要重启或重新加载。完成之后当你再在Cursor中与AI对话时AI就具备了控制你手机的能力。4. 核心功能实战与自然语言交互示例配置完成后你就可以开始体验用自然语言控制手机的魔力了。下面我列举几个典型场景并展示AIClaude模型会如何理解并调用PhonePi MCP提供的工具。4.1 通讯录与短信管理场景你正在写代码想起需要联系一个同事确认API细节。你的指令“帮我把李四的手机号保存到通讯录里他的名字是‘李四’号码是‘13800138000’。”AI的理解与行动AI通过MCP识别出这是一个“创建联系人”的请求。它会调用PhonePi MCP的create_contact工具并填入你提供的参数。稍等片刻AI会回复“已成功将李四13800138000添加到你的手机通讯录。” 你可以立刻在手机上验证。你的指令“给我老婆发条短信说‘我今晚加班晚点回家不用等我吃饭了。’”AI的行动AI首先可能需要查询通讯录如果它没有上下文找到“老婆”对应的电话号码。然后调用send_sms工具指定号码和短信内容。成功后回复“短信已成功发送至[老婆的号码]。”4.2 手机状态监控与查找场景手机不知道丢在家里的哪个角落了。你的指令“我的手机找不到了让它响一下。”AI的行动调用find_my_phone或类似工具手机会立即以最大音量播放响亮的提示音即使处于静音模式。这对于“手机在沙发缝里”的场景是救命功能。你的指令“我手机还剩多少电”AI的行动调用get_battery_status工具然后回复“你的手机当前电量为65%未在充电状态。”4.3 通知管理与快速回复场景你正在全屏演示手机收到一条微信消息。你的指令“我手机刚收到了什么通知”AI的行动调用get_recent_notifications工具获取最新的几条通知然后摘要式地汇报给你“1分钟前来自‘微信’老王‘方案你看过了吗’3分钟前来自‘邮箱’‘会议邀请项目评审’。”你的指令“回复老王的微信说‘看过了稍后详细回复你。’”AI的行动这可能需要调用更高级的工具如reply_to_notification并指定通知ID和回复内容。AI会尝试在通知栏进行快速回复。4.4 媒体控制与系统设置场景你在电脑上工作手机连着蓝牙音箱在播放播客。你的指令“暂停我手机上的播放。”AI的行动调用media_control工具执行“暂停”操作。你的指令“把手机亮度调到50%。”AI的行动调用set_brightness工具参数为50。实操心得自然语言交互的精髓在于“意图识别”。你不需要记住精确的工具名或参数格式只需用日常语言描述你的需求。AI模型特别是Claude 3.5 Sonnet及以上版本在理解复杂意图和链式调用工具方面表现非常出色。例如你说“提醒我下午三点给客户打电话”AI可能会先调用create_calendar_event或set_reminder工具创建提醒然后顺便调用get_contact找到客户电话并附在提醒详情里。5. 高级配置与跨网络访问方案基础的本地网络使用已经非常强大但如果你想实现“在任何地方都能控制家中手机”就需要解决跨网络问题。直接暴露家庭网络的端口到公网是危险且不推荐的。这里我详细讲解作者推荐的Tailscale方案。5.1 为什么选择TailscaleTailscale是一个基于WireGuard协议的零配置VPN服务。它神奇的地方在于穿透内网能打通不同NAT路由器后的设备让它们仿佛在同一个局域网。点对点加密设备间直接建立加密通道流量不经过Tailscale的中转服务器除非直连失败。极其简单几乎不需要任何网络知识安装客户端登录同一账号设备就自动组网了。5.2 使用Tailscale打通电脑与手机1. 注册与安装前往 Tailscale官网 注册一个免费账户。免费套餐对于个人使用完全足够。在你的电脑上安装Tailscale客户端。macOS可以用Homebrew (brew install tailscale)Linux有各发行版的包Windows有安装程序。在你的手机上通过App StoreiOS或Google PlayAndroid安装Tailscale App。2. 登录与组网在电脑和手机上分别打开Tailscale客户端用同一个账号登录。登录后两台设备会立即出现在你的Tailscale管理后台admin panel的设备列表中并且会自动获得一个100开头的内网IP如100.xx.xx.xx。3. 修改PhonePi MCP配置现在你的电脑和手机已经通过Tailscale虚拟网络连接。你需要让PhonePi MCP服务器监听这个虚拟网卡的地址或者允许来自Tailscale网络的连接。找到你电脑的Tailscale IP地址。在电脑的Tailscale客户端界面可以看到或者在终端运行tailscale ip。修改PhonePi MCP的.env文件将MCP_HOST改为0.0.0.0它已经可以了或者更精确地确保防火墙允许该端口。更关键的是手机App的连接地址需要更改。在手机App中将服务器地址从原来的本地局域网IPhttp://192.168.x.x:8000改为你电脑的Tailscale IPhttp://100.xx.xx.xx:8000。4. 连接测试保存配置重启MCP服务器。然后在手机App中使用新的Tailscale IP地址进行连接。如果成功即使你的手机使用蜂窝数据电脑连接公司网络你们依然可以互通。重要提示使用Tailscale后所有通信都经过加密隧道安全性比开放公网端口高几个数量级。但请务必保管好你的Tailscale账号因为获得你账号访问权的人也能看到你的设备列表。5.3 备选方案云服务器中转如果出于某些原因不想用Tailscale另一种方案是在一台拥有公网IP的云服务器如AWS EC2、Google Cloud VM上部署PhonePi MCP服务器。然后在云服务器上安装并运行PhonePi MCP。配置安全组只允许你的电脑IP和手机IP或通过VPN访问服务器的8000端口。将电脑上的AI客户端和手机App的服务器地址都指向云服务器的公网IP。这种方案的缺点是延迟可能更高且会产生云服务器费用。安全性依赖于你正确配置防火墙和可能使用的额外VPN。对于绝大多数个人用户Tailscale是更优解。6. 常见问题排查与调试技巧在实际部署和使用中你难免会遇到一些问题。下面是我遇到和收集的一些典型问题及其解决方法。6.1 连接类问题问题1手机App无法发现或连接电脑服务器。检查防火墙这是最常见的原因。确保你电脑的防火墙允许8000端口的传入连接。在macOS“系统设置-网络-防火墙”中可能需要为Python或终端应用添加例外。在Windows Defender防火墙中添加入站规则。确认IP地址确保手机App中输入的是电脑正确的局域网IP而不是127.0.0.1这是电脑本机回环地址手机无法访问。验证服务器状态在电脑浏览器访问http://电脑IP:8000如果服务器运行正常可能会返回一个简单的JSON信息或404页面。如果无法访问说明服务器未正确监听或网络不通。重启大法依次重启MCP服务器、手机App有时甚至重启路由器。问题2Cursor/Claude Desktop中不出现手机控制工具。检查MCP服务器配置确保在AI客户端中添加的MCP服务器地址是http://127.0.0.1:8000本地客户端用本地地址。重启AI客户端添加MCP服务器后通常需要完全重启Cursor或Claude Desktop才能生效。查看服务器日志在运行MCP服务器的终端里查看是否有来自客户端的连接请求。当你启动AI客户端时服务器日志应该会打印新的连接信息。如果没有说明客户端根本没连上。验证工具列表有些MCP客户端支持手动检查工具列表。在Cursor中你可以尝试在命令面板搜索“MCP”相关命令看看能否列出工具。6.2 功能类问题问题3AI可以调用工具但手机没反应例如短信发不出去。检查手机App权限前往手机系统设置找到PhonePi MCP App检查是否授予了相关权限如短信、联系人。没有权限App无法执行操作。查看手机App日志高级的App通常会有一个日志或通知界面显示接收到的指令和执行结果。检查这里是否有错误信息。服务器日志是关键MCP服务器的终端日志会详细记录它从AI客户端收到的请求、转发给手机App的请求以及手机App的响应。从这里可以判断问题是出在服务器-手机通信环节还是手机端执行环节。问题4使用Tailscale后连接不稳定。检查直连状态在Tailscale管理后台查看你电脑和手机两个设备之间的连接是否显示为“Direct”直连。如果是“Relay”中转速度会慢且不稳定。直连失败通常是因为复杂的NAT或防火墙。可以尝试重启两端Tailscale客户端或更换网络环境。禁用防火墙干扰有时电脑防火墙会阻止Tailscale的虚拟网卡。尝试暂时禁用防火墙测试。6.3 高级调试技巧当问题比较复杂时你需要更系统地排查分层测试法层1服务器本身运行curl http://127.0.0.1:8000在电脑本地测试服务器是否存活。层2局域网可达性用同一局域网内的另一台设备或手机浏览器访问http://电脑IP:8000测试服务器是否监听在正确接口。层3MCP协议通信使用专业的MCP客户端测试工具如mcp-cli连接服务器手动列出并调用工具排除AI客户端的问题。层4手机-App-服务器链路在手机App中查看连接状态和接收到的指令。活用日志将PhonePi MCP服务器的日志级别设置为DEBUG在.env中修改LOG_LEVELDEBUG重启服务器。你会看到非常详细的通信数据这对于诊断协议错误或数据格式问题至关重要。社区与源码如果遇到疑似Bug首先去项目的GitHub仓库的Issues页面搜索是否有类似问题。如果没有可以按照规范提交一个新Issue详细描述你的环境、步骤、日志和预期行为。开源项目的生命力就在于社区协作。7. 扩展思路与潜在应用场景PhonePi MCP的基础功能已经很强大了但它的潜力远不止于此。基于其可编程的MCP接口我们可以想象更多自动化场景场景一开发调试助手作为一名开发者我经常需要在手机和电脑间同步日志、传输测试文件。我可以编写一个脚本监听电脑上某个目录的变化当有新的日志文件时自动通过PhonePi MCP的“分享文件”或“发送消息”工具将文件或关键信息推送到手机通知上让我在外出时也能及时知晓构建结果或错误。场景二家庭自动化中枢将手机作为家庭物联网的遥控器。通过AI我可以语音控制手机进而通过IFTTT、Home Assistant的Webhook或Tasker插件触发家中的智能设备。例如“打开客厅的灯”、“把空调调到26度”。PhonePi MCP成为了自然语言到手机自动化指令的翻译官。场景三个人健康数据看板结合手机的健康数据需要相应权限可以让AI定期汇报你的步数、睡眠情况甚至在你久坐时通过AI助手提醒你起来活动。这需要PhonePi MCP提供读取健康数据的工具或者通过读取通知摘要来实现。场景四隐私敏感操作的确认网关对于一些敏感操作如支付确认、授权登录可以设计为AI接收到指令后通过PhonePi MCP在手机上弹出一个需要手动确认的对话框而不是直接执行。这样既利用了AI的便利又保留了最终的人为控制权安全与便捷兼得。PhonePi MCP项目为我们展示了一个未来人机交互的雏形设备不再是孤岛AI不再是空谈它们通过标准化的协议MCP紧密协作成为我们能力的自然延伸。它的搭建过程虽然涉及多个环节但每一步都有清晰的逻辑。一旦跑通你会发现这种“用说话控制一切”的体验具有一种回归自然的流畅感。

相关文章:

PhonePi MCP:基于MCP协议实现AI助手远程控制手机的完整指南

1. 项目概述:将你的手机变成AI助手的智能工具箱 如果你和我一样,日常工作中重度依赖像Cursor、Claude Desktop这类AI编程助手,那你肯定遇到过这样的场景:正在电脑前专注写代码,手机突然在另一个房间响了,或…...

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence …...

Go语言实现轻量级TCP/UDP代理:核心原理、源码解析与实战部署

1. 项目概述:一个轻量级代理转发工具的核心设计最近在折腾一些本地服务联调和跨网络访问的场景时,经常遇到一个痛点:某个服务只监听在本地回环地址(127.0.0.1),或者因为网络策略限制,无法从外部…...

AI时代网络安全教学:伦理困境、框架设计与实践路径

1. 项目概述:当AI成为课堂的“助教”与“考题”最近几年,AI技术,特别是大语言模型,像潮水一样涌入了各行各业。网络安全这个领域,作为技术的前沿阵地,感受尤为深刻。以前我们教学生,讲的是如何分…...

CANN量化索引器元数据文档

QuantLightningIndexerMetadata 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 产品支持情况 产品是否支持 Atlas A3 …...

XUnity翻译器:告别语言障碍,畅玩全球Unity游戏的终极指南

XUnity翻译器:告别语言障碍,畅玩全球Unity游戏的终极指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为看不懂的日文RPG、韩文视觉小说或英文独立游戏而烦恼吗&#xff1f…...

CANN/catlass A8W4 MX量化矩阵乘法示例

A8W4MxMatmul Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 注意:社区包暂不支持 950 能力,后续支持的版本敬请…...

iPhone价格撑不住了,苹果内存即将见底;追觅CEO要求全员开通社交账号;DeepSeek多模态模型技术报告公布 | 极客头条

「极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。(投稿或寻求报道:zhanghycsdn.net)整理 | 苏宓出品 | CSDN(ID&…...

第二十天打卡逆波兰表达式求值

除法向零截断:这意味着 6 / -132 结果是 0,且 C 中整数除法默认就是向零截断,符合题目要求。操作数顺序:对于减法和除法,先弹出的数是右操作数,后弹出的数是左操作数。例如遇到 -,若栈顶是 b&am…...

大语言模型推理能力与自指认知的架构解析

1. 大语言模型推理能力的底层架构解析大语言模型的逻辑推理能力建立在Transformer架构的多层自注意力机制之上。这种架构设计使得模型能够通过注意力权重动态构建不同概念之间的关联网络。在推理任务中,特定模式的注意力分布会形成类似人类"思维链"的信息…...

CANN框架适配模板

框架适配模板 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 替换 {model_name}(小写下划线)和…...

我做了一个 Agent Skill,一句话生成一镜到底城市宣传片

上周,我制作了一个 skill ,用这个 skill 可以一键直出符合生成 seedance2.0 视频生成模型的城市宣传片分镜提示词,这个 skill 可以让你在 15 秒的视频当中,做出一镜到底效果的城市宣传片。我为什么制作这么一个 skill 呢&#xff…...

AI代码溯源工具clawd-blame:为AI生成代码建立对话上下文映射

1. 项目概述:一个为AI编程时代量身定制的“代码溯源”工具如果你和我一样,深度依赖 Cursor 这类 AI 驱动的 IDE 进行日常开发,那你一定遇到过这个令人头疼的场景:面对一段由 Claude 生成的、逻辑复杂但注释寥寥的代码,…...

轻量级Docker管理面板clawpanel:部署、安全与实战应用指南

1. 项目概述与核心价值最近在折腾一个自托管项目时,发现了一个挺有意思的玩意儿——qingchencloud/clawpanel。这名字乍一看有点抽象,“爪面板”?但如果你和我一样,经常在Docker生态里摸爬滚打,看到这个项目托管在Dock…...

3个步骤让Windows用户也能享受AirPods完整功能:AirPodsDesktop深度指南

3个步骤让Windows用户也能享受AirPods完整功能:AirPodsDesktop深度指南 【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDesktop …...

从开发者控制台体验Taotoken计费与用量观测的透明度

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 从开发者控制台体验Taotoken计费与用量观测的透明度 对于依赖大模型API进行开发的团队和个人而言,成本控制与资源管理是…...

CANN ops-math矩阵对角线提取算子

MatrixDiagPartV3 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理…...

Arm GICv5中断控制器架构解析与应用实践

1. GICv5架构概述GICv5是Arm公司推出的第五代通用中断控制器架构,作为现代计算系统中的关键基础设施组件,它承担着高效管理和分发硬件中断请求的重要职责。在Armv9架构体系中,GICv5通过创新的中断分类机制和灵活的CPU接口设计,为多…...

为 OpenClaw 配置 Taotoken 作为模型供应商的详细步骤

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为 OpenClaw 配置 Taotoken 作为模型供应商的详细步骤 OpenClaw 是一个流行的开源智能体框架,它允许开发者轻松构建和运…...

现代前端工程化实践:从零构建高效开发环境与自动化工作流

1. 项目概述:一个面向现代前端的“工艺”工具箱最近在GitHub上闲逛时,发现了一个名为frontcraft的项目,作者是Dragoon0x。这个项目名很有意思,front自然指的是前端,而craft这个词,直译是“工艺”、“手艺”…...

CANN/asc-devkit AddReluCast算子API

AddReluCast 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.co…...

AI编程助手如何从“代笔”变“导师”?学习者模式实战指南

1. 项目概述:告别“喂饭式”编程,开启主动学习模式如果你用过 Cursor 或 GitHub Copilot,大概率有过这样的体验:面对一个复杂功能,你刚敲下注释,AI 就“唰”地一下把几十行完整的、甚至有些“黑盒”的代码怼…...

CANN/sip Sinc插值算子

rsInterpolationBySinc 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库,基于华为Ascend AI处理器,专门为信号处理领域而设计。 项目地址: https://gitcode.com/cann/sip 产品支持情况 产品是否支持Atlas 200I…...

AwaRes高分辨率视觉语言模型区域检索技术解析

1. 项目概述AwaRes是一个专注于高分辨率视觉语言模型区域检索的创新框架。在计算机视觉与自然语言处理的交叉领域,如何精准定位图像中与文本描述相匹配的高分辨率区域一直是个技术难点。传统方法要么牺牲分辨率换取处理速度,要么计算成本过高难以实际应用…...

基于MCP协议实现AI助手与n8n自动化平台的无缝集成

1. 项目概述:当AI助手遇上自动化引擎如果你和我一样,每天要在n8n里折腾十几个自动化工作流,同时又在Cursor里和AI助手讨论代码逻辑,那你肯定想过一个问题:能不能让AI直接帮我操作n8n?不用切屏,不…...

CANN/opbase预留执行器接口

预留接口 【免费下载链接】opbase 本项目是CANN算子库的基础框架库,为算子提供公共依赖文件和基础调度能力。 项目地址: https://gitcode.com/cann/opbase 本章接口为预留接口,后续有可能变更或废弃,不建议开发者使用,开发…...

多模态大模型如何重塑科学教育:从虚拟实验到个性化辅导

1. 项目概述:当科学教育遇上“多模态”大脑如果你是一位科学老师,或者对教育科技感兴趣,可能已经注意到一个现象:传统的“书本黑板”或“PPT讲解”模式,正在面临前所未有的挑战。学生对着抽象的公式和二维的图表发呆&a…...

杀疯了!7 款国内外 IDEA AI 插件大乱斗,谁是 AI Coding 世界第一?

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

Shell脚本AI助手:终端集成Ollama与OpenAI的智能运维实践

1. 项目概述:一个纯粹的Shell脚本智能终端助手 在终端里直接和AI对话,让它帮你写命令、分析日志、解答技术问题,甚至管理本地的大语言模型——听起来是不是很酷?这就是 shell-pilot 带给我的核心体验。作为一个常年泡在终端里的…...

为OpenClaw智能体工作流配置Taotoken多模型后端

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为OpenClaw智能体工作流配置Taotoken多模型后端 对于使用OpenClaw框架构建AI工作流的开发者而言,灵活选择并接入不同的…...