当前位置: 首页 > article >正文

Open-AutoGLM快速上手:用自然语言操控手机,小白也能轻松学会

Open-AutoGLM快速上手用自然语言操控手机小白也能轻松学会1. 什么是Open-AutoGLMOpen-AutoGLM是智谱开源的一个手机端AI智能助理框架它能让你的普通安卓手机瞬间拥有类似豆包手机的智能操作能力。简单来说就是你可以用自然语言告诉手机要做什么比如打开小红书搜美食它就会自动帮你完成整个操作流程。这个框架的核心技术是基于视觉语言模型的多模态理解能力。它能看懂手机屏幕上的内容并通过ADB(Android Debug Bridge)来自动操控设备。相比传统自动化工具它的最大特点是能理解复杂指令并智能规划操作步骤。2. 准备工作环境与设备2.1 硬件与环境要求在开始之前请确保你具备以下条件电脑Windows或macOS系统手机Android 7.0及以上版本的手机或模拟器Python环境建议Python 3.10ADB工具用于连接和控制安卓设备2.2 安装ADB工具ADB是Android Debug Bridge的简称是谷歌提供的用于与安卓设备通信的命令行工具。安装步骤如下Windows用户下载ADB工具包解压到任意目录配置环境变量右键此电脑→属性→高级系统设置→环境变量在系统变量中找到Path点击编辑→新建添加ADB解压路径验证安装打开命令提示符输入adb version应显示版本信息macOS用户# 假设解压目录为~/Downloads/platform-tools export PATH${PATH}:~/Downloads/platform-tools3. 手机端设置要让电脑能控制你的手机需要进行一些必要的设置3.1 开启开发者模式进入手机设置→关于手机连续点击版本号7次直到提示您已处于开发者模式返回设置找到新出现的开发者选项3.2 启用USB调试在开发者选项中找到USB调试并开启连接手机到电脑时选择文件传输模式在电脑终端输入adb devices应能看到设备ID3.3 安装ADB Keyboard为了让电脑能直接向手机输入文字需要安装一个特殊输入法下载ADB Keyboard APK在手机上安装该应用进入设置→系统→语言和输入法→虚拟键盘启用ADB Keyboard作为默认输入法4. 部署Open-AutoGLM控制端4.1 下载代码与安装依赖在电脑上打开终端执行以下命令# 克隆仓库 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 安装依赖 pip install -r requirements.txt pip install -e .4.2 连接设备有两种方式连接手机USB连接用数据线连接手机和电脑在终端输入adb devices确认设备已连接WiFi连接# 先用USB连接开启TCP/IP模式 adb tcpip 5555 # 断开USB连接手机IP adb connect 192.168.x.x:55555. 运行你的第一个AI指令一切准备就绪现在可以尝试让AI帮你操作手机了5.1 基础命令运行在Open-AutoGLM目录下执行python main.py \ --device-id 你的设备ID或IP:5555 \ --base-url http://云服务器IP:映射端口/v1 \ --model autoglm-phone-9b \ 打开抖音搜索抖音号为dycwo11nt61d 的博主并关注他参数说明--device-id通过adb devices获取的设备ID--base-url云服务器API地址最后的字符串你要AI执行的自然语言指令5.2 Python API调用示例如果你想在自己的Python项目中使用可以参考以下代码from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn ADBConnection() # 连接远程设备 success, message conn.connect(192.168.1.100:5555) print(f连接状态: {message}) # 列出已连接设备 devices list_devices() for device in devices: print(f{device.device_id} - {device.connection_type.value}) # 在USB设备上启用TCP/IP success, message conn.enable_tcpip(5555) ip conn.get_device_ip() print(f设备IP: {ip}) # 断开连接 conn.disconnect(192.168.1.100:5555)6. 常见问题与解决方案6.1 连接问题ADB设备未识别检查USB调试是否开启尝试更换数据线WiFi连接不稳定建议首次配置使用USB稳定后再切换WiFi防火墙阻挡确保云服务器端口已开放6.2 操作问题AI无法识别界面元素确保屏幕亮度足够无遮挡操作被中断某些安全界面需要人工确认速度慢复杂任务可能需要2-3分钟完成6.3 支持的应用列表目前支持的主流应用包括分类应用社交通讯微信、QQ、微博电商购物淘宝、京东、拼多多美食外卖美团、饿了么、肯德基出行旅游携程、12306、滴滴出行视频娱乐bilibili、抖音、爱奇艺音乐音频网易云音乐、QQ音乐、喜马拉雅生活服务大众点评、高德地图、百度地图内容社区小红书、知乎、豆瓣7. 总结与进阶建议通过本文你已经学会了如何用Open-AutoGLM让你的普通安卓手机拥有智能助理能力。相比传统自动化工具它的优势在于自然语言交互直接用说话的方式控制手机智能规划能理解复杂指令并分解为操作步骤多模态理解能看懂屏幕内容并做出判断进阶建议尝试组合多个指令如打开美团点一份附近的火锅然后分享到微信群里对于频繁重复的任务可以编写脚本批量执行关注项目更新新版本会支持更多应用和功能虽然当前版本还无法完全替代人工操作特别是在需要主观判断的场景但对于重复性任务已经能大幅提升效率。随着技术发展未来这类AI助理的能力将会越来越强大。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Open-AutoGLM快速上手:用自然语言操控手机,小白也能轻松学会

Open-AutoGLM快速上手:用自然语言操控手机,小白也能轻松学会 1. 什么是Open-AutoGLM? Open-AutoGLM是智谱开源的一个手机端AI智能助理框架,它能让你的普通安卓手机瞬间拥有类似"豆包手机"的智能操作能力。简单来说&am…...

王伟光:学习先天易学,首要认识太极图,理解能量守恒

王伟光:学习先天易学,首要认识太极图,理解能量守恒。太极图为什么配先天八卦?因为先天八卦是真的,后天八卦是假的。太极图体现真太阳时变速定律,同时预示能量守恒定律。王伟光先天奇门属于先天易学&#xf…...

如何用轻量级React框架提升前端开发效率?

如何用轻量级React框架提升前端开发效率? 【免费下载链接】nextui 🚀 Beautiful, fast and modern React UI library. 项目地址: https://gitcode.com/GitHub_Trending/ne/nextui 项目定位与核心价值 为什么选择这款轻量级React框架?…...

chronyd配置实战:如何让Linux服务器时间同步快如闪电(附iburst参数详解)

Chronyd配置实战:如何让Linux服务器时间同步快如闪电(附iburst参数详解) 在分布式系统和云计算环境中,时间同步的准确性往往决定着整个系统的可靠性。想象一下这样的场景:当你在Kubernetes集群中部署微服务时&#xff…...

AI Agent 设计模式:从理论到实践的完整指南

AI Agent 设计模式:从理论到实践的完整指南 AI Agent 是一种能够感知环境、自主决策并执行动作的智能实体。其设计模式涵盖了从理论模型到实际实现的全过程,涉及感知、决策、执行和反馈等核心模块。以下从理论框架、设计模式分类、实现方法和代码示例展开…...

机器学习、数据科学、深度学习、神经网络的区别与联系

机器学习、数据科学、深度学习与神经网络的区别与联系 机器学习(Machine Learning)、数据科学(Data Science)、深度学习(Deep Learning)和神经网络(Neural Networks)是当前人工智能领…...

Golang指针的基本概念

Golang 指针的基本概念 指针是编程语言中一个重要的概念,它允许直接操作内存地址。在Golang中,指针的使用相对简单,但理解其基本原理和用法对于编写高效、安全的代码至关重要。 什么是指针 指针是一种变量,其值为另一个变量的内存…...

Youtu-VL-4B-Instruct多模态推理:化学分子式图像识别+反应路径推理案例

Youtu-VL-4B-Instruct多模态推理:化学分子式图像识别反应路径推理案例 1. 引言:当AI“看懂”化学结构图 想象一下,你是一位化学专业的学生或研究员,面对一篇文献中复杂的分子结构图,需要快速理解它的构成&#xff0c…...

基于 HTML/CSS 的毕业设计:从静态页面到工程化实践的深度指南

最近在帮学弟学妹们看毕业设计,发现一个挺普遍的现象:很多同学觉得用 HTML 和 CSS 做个静态页面,能看就行,任务就算完成了。结果交上去的代码,结构混乱、样式互相覆盖、手机上一打开布局全乱,更别提后续维护…...

第九章:装饰器模式 - 动态增强的艺术大师

第九章:装饰器模式 - 动态增强的艺术大师 人生如逆水行舟,要在不断的拼搏中成长,唯有在艰难困苦面前依然坚持,才能开辟辽阔未来。真正的勇气在于面对困惑时的微笑,不怕未知,让内心的坚定信念指引我们走向光…...

Qwen3-ASR-1.7B镜像免配置优势:无需ffmpeg编译,原生支持mp3解码

Qwen3-ASR-1.7B镜像免配置优势:无需ffmpeg编译,原生支持mp3解码 如果你曾经尝试过部署一个语音识别模型,大概率会遇到一个让人头疼的问题:音频格式支持。特别是当你兴致勃勃地准备处理一个mp3文件时,却发现模型只认wa…...

GitHub 官宣 GitHub Copilot CLI 开发公测:AI CLI 大战

GitHub Copilot CLI 公测:AI 驱动的命令行革命 GitHub 近期宣布 Copilot CLI 进入开发公测阶段,标志着 AI 在命令行工具领域的深度渗透。这一工具旨在通过自然语言理解能力,帮助开发者更高效地完成终端操作,同时减少对复杂命令的记…...

TradingAgents-CN智能交易系统:从基础到进阶的全方位应用指南

TradingAgents-CN智能交易系统:从基础到进阶的全方位应用指南 【免费下载链接】TradingAgents-CN 基于多智能体LLM的中文金融交易框架 - TradingAgents中文增强版 项目地址: https://gitcode.com/GitHub_Trending/tr/TradingAgents-CN 一、概念解析&#xff…...

PyCharm2025.2 大更新,AI是亮点!

PyCharm2025.2 大更新,AI是亮点! 生活中的每一个精彩都是用心编织的梦想,愿我们在每个转角都能迎来新的希望与喜悦。每一个清晨都是一扇新的窗,打开它的方式在于勇敢,而非犹豫,让生活焕发无限的光彩。每一份…...

Leather Dress Collection从零开始:LoRA微调入门——基于Leather Romper数据集

Leather Dress Collection从零开始:LoRA微调入门——基于Leather Romper数据集 1. 引言 你有没有想过,让AI帮你设计一套独一无二的皮革服装?或者你是个服装设计师,想快速生成不同款式的皮革服装概念图?今天我要分享的…...

工业自动化必备:三相异步电机不停机效率检测实战(附MATLAB代码)

工业自动化必备:三相异步电机不停机效率检测实战(附MATLAB代码) 在现代化工业生产中,电机作为核心动力源,其运行状态直接影响着生产线的稳定性和能效表现。传统电机效率检测方法往往需要停机拆卸,不仅影响生…...

【LM】(九)语言模型评估实战:从困惑度Perplexity到模型优化策略

1. 困惑度Perplexity的本质与实战意义 第一次接触困惑度(Perplexity)这个概念时,我盯着公式看了半天也没明白它到底想表达什么。直到在实际项目中用起来才发现,这个看似抽象的概念其实非常直观。简单来说,困惑度就是衡量语言模型"有多困…...

具身智能机器人测试技术全解析

具身智能机器人的场景测试技术解析 具身智能(Embodied AI)强调智能体通过物理交互与环境共同进化,而机器人作为典型载体,其测试需覆盖极端环境仿真、自动化故障注入等关键环节。以下从技术实现到代码示例展开解析。极端环境仿真构…...

35KV机械厂变电站设计实战:从主接线方案到设备选型全流程解析

35KV机械厂变电站设计实战:从主接线方案到设备选型全流程解析 走进任何一家现代化机械制造工厂,轰鸣的机床、自动化的生产线背后,都离不开一个稳定可靠的电力供应系统。作为工厂电力系统的"心脏",35KV变电站的设计质量直…...

从“可替代”到“不可复制”:我在代码里刻入灵魂印记

被误解的“流水线工”在软件开发的生命周期中,测试工程师常被简化为“找Bug的流水线工”——需求评审时沉默的旁听者,代码完成后机械的执行者,交付前疲于奔命的救火队员。这种刻板印象催生着行业的集体焦虑:当自动化工具吞噬基础用…...

5个HTML转PDF渲染优化解决方案:从样式错乱到完美输出

5个HTML转PDF渲染优化解决方案:从样式错乱到完美输出 【免费下载链接】wkhtmltopdf 项目地址: https://gitcode.com/gh_mirrors/wkh/wkhtmltopdf 在网页转PDF的实际应用中,开发者常面临三大核心挑战:CSS样式渲染异常、页面布局错乱、…...

Leather Dress Collection部署案例:跨境电商团队日均生成200+皮革新品图

Leather Dress Collection部署案例:跨境电商团队日均生成200皮革新品图 1. 项目背景与价值 在跨境电商领域,商品图片是吸引消费者的第一道门槛。传统拍摄方式面临诸多挑战: 成本高昂:专业摄影棚、模特、服装样品等投入大效率低…...

Face3D.ai Pro开箱即用:内置状态监控侧边栏,实时显示GPU温度与显存

Face3D.ai Pro开箱即用:内置状态监控侧边栏,实时显示GPU温度与显存 1. 引言:当3D重建遇见工业级监控 想象一下,你正在为一个游戏角色或虚拟主播制作高精度3D人脸模型。传统的流程需要专业的3D扫描设备,或者美术师花费…...

航空发动机硬件在环(HIL)测试

面向民机适航验证与军机极限工况需求,提供高可信度、可扩展的发动机控制系统 HIL 整体解决方案...

GLM-4.7-Flash快速体验:Ollama简单部署,即刻开启智能对话

GLM-4.7-Flash快速体验:Ollama简单部署,即刻开启智能对话 1. GLM-4.7-Flash模型简介 GLM-4.7-Flash是当前30B参数级别中最具竞争力的混合专家模型。这个模型在保持轻量化的同时,提供了接近更大模型的性能表现,特别适合需要平衡计…...

以太网硬件测试全解析:从基础到实战

1. 以太网硬件测试入门指南 刚接触以太网硬件测试时,我也被各种专业术语和测试项目搞得一头雾水。经过多年实战,我发现只要掌握几个核心测试点,就能快速判断一个网口硬件是否达标。先说说最基础的测试工具配置,这也是最容易踩坑的…...

Audio Pixel Studio效果惊艳:长文本TTS断句优化+停顿时长人工干预实测

Audio Pixel Studio效果惊艳:长文本TTS断句优化停顿时长人工干预实测 1. 语音合成新体验:当技术遇见艺术 Audio Pixel Studio正在重新定义语音合成的用户体验。这款基于Streamlit开发的轻量级Web应用,将专业级音频处理能力封装在清新简约的…...

三菱FX系列PLC与RS422设备跨协议通讯方案——新能源光伏智造应用案例

新能源光伏行业作为国家双碳战略核心赛道,光伏组件智能制造是当下增速最快、政策扶持力度大、发展前景广阔的工业细分领域,工业自动化与工业物联网深度融合,成为光伏企业提升产能、保障产品良率、实现全流程数字化管控的核心抓手。某头部光伏…...

档案宝智能系统+“龙虾”,让档案调阅秒级完成,告别异地奔波

在数字化转型飞速推进的今天,档案管理作为企事业单位、政务部门的核心工作之一,仍有不少人被“调档难、跑断腿”的问题困扰:异地查档要跨城奔波、耗时数日,本地调档要翻箱倒柜、反复核对,哪怕是一份简单的档案复印件&a…...

智能体(Agent)是什么?2026年AI助理的入门指南

本文是我学习AI智能体(Agent)概念的第三周笔记,记录了从最初听到“Agent”这个词的困惑,到逐步理解它如何成为我的“数字同事”的过程。文章结构:定义→核心能力→应用场景→工具推荐→学习路径,适合AI入门…...