当前位置: 首页 > article >正文

5分钟Mac本地跑通32B Qwen!免费GPT-4o替代,还能5分钟造个会开浏览器+执行Shell的AI Agent

1. 硬件与模型选择配置Apple M2 Pro19 核 GPU、32GB 统一内存。推荐模型mlx-community/Qwen2.5-Coder-32B-Instruct-4bit4bit 量化后只占 18-22GB 内存专为代码和 Agent 优化Tool Calling 能力强MLX 原生支持 Metal 4速度和功耗最优2. 环境搭建5 分钟用pip3即可python3 -m venv ~/mlx-env source ~/mlx-env/bin/activate pip3 install --upgrade pip pip3 install mlx-lm以后每次新开终端先执行source ~/mlx-env/bin/activate进入环境。3. 首次下载模型必看自动触发首次运行任何 mlx_lm 命令时会自动下载模型权重# 推荐用这个命令安全触发下载只下载不聊天 mlx_lm.generate --model mlx-community/Qwen2.5-Coder-32B-Instruct-4bit --prompt hello --max-tokens 10下载大小18.4 GB.safetensors 权重文件下载时间普通家用宽带 3-8 分钟慢速网络或高峰期可能 10-20 分钟存储位置~/.cache/huggingface/hub/models--mlx-community--Qwen2.5-Coder-32B-Instruct-4bit磁盘要求确保至少25GB空闲空间后续运行无需重复下载下次秒开下载完成后模型就永久保存在本地。4. 命令行直接运行模型下载完成后进入环境执行# 交互聊天推荐 mlx_lm.chat --model mlx-community/Qwen2.5-Coder-32B-Instruct-4bit --temp 0.7 --context-length 32768输入问题即可实时对话。退出输入/exit。单次生成用mlx_lm.generate加--prompt。图1Decoder-only Transformer 结构Qwen 正是这种架构每层做 Masked Self-Attention FFN5. LLM 运行机制Transformer 执行器 权重LLM 本质只有两部分架构Transformer 代码mlx-lm 里models/qwen2.py已实现权重320 亿个数字18.4GB 文件训练好的参数mlx-lm 就是执行器加载权重到 GPU按 Transformer 规则一步步计算输出。它不是编译源代码只是把预训练好的权重加载运行。6. KV Cache生成加速的核心生成文字是“每次只出一个词再把新词加回去继续生成”。没有 KV Cache 时每次都要重新算前面所有词的 Key/Value速度极慢。KV Cache 把历史 Key 和 Value 存起来下次只算新词速度提升 3-10 倍。你的 32k 上下文全靠它实现。图2有/无 KV Cache 的对比紫色部分直接从缓存拿省去重复计算7. mlx-lm 内部具体做了什么每次运行mlx-lm 按顺序执行 7 步加载权重到 GPU把提示词转成 token IDPrefill一次性算完整个提示词建好 KV CacheDecode 循环每次只输入上一个词用 KV Cache 计算新词采样下一个词转回文字输出KV Cache 自动追加图3Prefill黄色 Decode红色完整流程TTFT 是首字延迟后续飞快想看真实过程运行下面测试脚本cat test_flow.py EOF from mlx_lm import load, stream_generate model, tokenizer load(mlx-community/Qwen2.5-Coder-32B-Instruct-4bit) prompt tokenizer.apply_chat_template([{role:user,content:写个 Python 函数}], add_generation_promptTrue) for resp in stream_generate(model, tokenizer, prompt, verboseTrue): print(resp.text, end, flushTrue) EOF python test_flow.py8. 实战5 分钟做一个能控制浏览器和 Shell 的 Agent安装浏览器依赖pip3 install playwright playwright install chromium创建 Agent48 行并运行cat ~/mini_openclaw_agent.py EOF from mlx_lm import load, generate import subprocess from playwright.sync_api import sync_playwright import re model, tokenizer load(mlx-community/Qwen2.5-Coder-32B-Instruct-4bit) SYSTEM 你是简易 OpenClaw Agent。需要工具时严格输出 toolshell_exec/toolarg命令/arg 或 toolbrowser_open/toolargURL/arg history [{role: system, content: SYSTEM}] def execute_tool(tool, arg): if tool shell_exec: return subprocess.check_output(arg, shellTrue, textTrue, timeout15).strip() elif tool browser_open: with sync_playwright() as p: page p.chromium.launch().new_page() page.goto(arg) return page.title() while True: user input(\n你: ) if user in [exit, quit]: break history.append({role: user, content: user}) prompt tokenizer.apply_chat_template(history, add_generation_promptTrue) response generate(model, tokenizer, promptprompt, max_tokens512, temp0.7) match re.search(rtool(.*?)/tool\s*arg(.*?)/arg, response, re.DOTALL) if match: tool, arg match.group(1).strip(), match.group(2).strip() print(f\n执行工具 {tool}({arg})) result execute_tool(tool, arg) print(result) history.append({role: tool, content: result}) else: print(response) history.append({role: assistant, content: response}) EOF python ~/mini_openclaw_agent.py输入“打开 https://x.ai 并告诉我标题”或“列出当前目录文件”Agent 就会自动执行。

相关文章:

5分钟Mac本地跑通32B Qwen!免费GPT-4o替代,还能5分钟造个会开浏览器+执行Shell的AI Agent

1. 硬件与模型选择 配置:Apple M2 Pro(19 核 GPU)、32GB 统一内存。 推荐模型:mlx-community/Qwen2.5-Coder-32B-Instruct-4bit 4bit 量化后只占 18-22GB 内存专为代码和 Agent 优化,Tool Calling 能力强MLX 原生支持…...

Vim-signify 异步更新技巧:让你的 Vim 编辑器更智能

Vim-signify 异步更新技巧:让你的 Vim 编辑器更智能 【免费下载链接】vim-signify :heavy_plus_sign: Show a diff using Vim its sign column. 项目地址: https://gitcode.com/gh_mirrors/vi/vim-signify Vim-signify 是一个强大的 Vim/Neovim 插件&#xf…...

关于reverse的tea题目回顾

ea的短暂性小总结说实话今天做的内容不算太多,但是感觉很超出自己的承受范围。 话不多说进行短暂总结tea模式tea的题目做起来的话公式比较固定。就比如用下面这个简单的题目进行示范这个就是图片,有en和de两种模式。de是我自己写出来的。查看en代码时能够…...

告别残差加法,Kimi 给神经网络换了个 “智能引擎”

来源:算法进阶 本文约2800字,建议阅读6分钟本文介绍了 Kimi 团队用 Attention Residuals 替代传统残差机制的成果。只要接触深度学习神经网络的读者们对「」一定不会陌生。自从 2015 年 ResNet 诞生以来,这种「将输入直接加到输出上」的简单逻…...

OpCore-Simplify:如何用四步自动化配置解决黑苹果安装难题?

OpCore-Simplify:如何用四步自动化配置解决黑苹果安装难题? 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify OpCore-Simplify是…...

革新性量化交易平台:基于Backtrader的高效策略回测工具实现方法

革新性量化交易平台:基于Backtrader的高效策略回测工具实现方法 【免费下载链接】backtrader-pyqt-ui 项目地址: https://gitcode.com/gh_mirrors/bac/backtrader-pyqt-ui Backtrader可视化平台是一款融合PyQt界面框架与finplot图表库的革新性量化交易回测工…...

从作业到考试:中科大数字图像分析(DIA)课程避坑与自学指南

中科大数字图像分析(DIA)课程高效学习与实战避坑指南 数字图像分析(DIA)作为中科大电子工程与信息科学系的专业基础课,以其知识面广、难度高著称。每年都有不少同学因低估课程强度而陷入"上课听不懂、作业不会做、考前突击难"的困境。本文将系统梳理从日常…...

Microsoft团队提出“弯曲雅各布天梯”新思路,了解量子数据如何教会AI做更好的化学

来源:ScienceAI 本文约3500字,建议阅读5分钟量子计算机生成精确数据,AI模型学习并实现百万倍加速预测。有时,一个视觉上引人注目的隐喻,足以让你传达一个复杂的观点。2001 年夏天,杜兰大学物理教授 John P.…...

前端开发中的加载指示器(Loading Spinners)一种动态旋转的图形元素(如圆圈、齿轮状动画)

在 Android 中,Spinner 是一个下拉选择控件,用于从预定义列表中选择一项。以下是标准、稳定、兼容性好的实现方式(基于 ViewBinding ArrayAdapter,适配 AndroidX 和 API 21):✅ 一、绑定数据(以…...

C 里面如何使用链表 list

1. 学生时代, 那会学习 C 数据结构, 比较简单 struct person {int id;char name[641];struct person * next; }; 类似上面这样, 需要什么依赖 next 指针来回调整, 然后手工 print F5 去 debug 熬. 2. 刚工作青年时代, 主要花活, 随大流类似 #pragma once#include "stru…...

TensorFlow开发中用到的一些第三方库

本节介绍下后面开发要用到的辅助库,并做一些简单的代码实例和效果演示,当然我们都是为了最终目标TensorFlow开发做准备的,用到的也是这些库的简单的api,这里做简单的介绍为后面TensorFlow开发做准备,对于这些库的深入研…...

GHelper:华硕笔记本性能优化与硬件控制的开源解决方案

GHelper:华硕笔记本性能优化与硬件控制的开源解决方案 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Sc…...

TensorFlow的一些基本概念

分类问题和回归问题 在实际生活中,人们面临的问题无非就是离散的和连续的。 比方区分出某个人属于男性还是女性,比方衣服是什么颜色的,什么种类的,这些都是在有限数量的结果中寻找答案,也就是最终结果只能是N个里面的某…...

NI USB-6210 DAQ采集卡开箱照

1、包装非常简单,有点对不起它6000~7000元的价格:2、 内部也没有什么特别的:3、一张用户须知,一本使用说明:4、一张光盘,感觉有点Low,现在电脑很少有光驱了:5、这条USB线据说要200大…...

SmolVLA企业应用:轻量级VLA模型赋能AGV分拣与桌面机械臂

SmolVLA企业应用:轻量级VLA模型赋能AGV分拣与桌面机械臂 1. 引言:当机器人开始“看懂”世界 想象一下,你对着一个机械臂说:“把那个红色的方块拿起来,放到蓝色的盒子里。”然后它真的照做了。这不是科幻电影&#xf…...

7大核心优势!D3KeyHelper暗黑3智能宏工具全面解析:从手动操作到自动化体验的升级之路

7大核心优势!D3KeyHelper暗黑3智能宏工具全面解析:从手动操作到自动化体验的升级之路 【免费下载链接】D3keyHelper D3KeyHelper是一个有图形界面,可自定义配置的暗黑3鼠标宏工具。 项目地址: https://gitcode.com/gh_mirrors/d3/D3keyHelp…...

ai辅助开发:向快马描述需求,直接生成jdk1.8实现的控制台通讯录项目

最近在尝试用Java开发一个简单的命令行通讯录程序,正好借这个机会体验了一把AI辅助开发的便利。整个过程让我深刻感受到,合理利用工具真的能大幅提升开发效率。下面记录下这个项目的实现思路和关键点,或许对同样想用JDK1.8练手的朋友有帮助。…...

突破8大平台限制:开源工具实现高速下载的3种创新方案

突破8大平台限制:开源工具实现高速下载的3种创新方案 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

Open UI5 源代码解析之854:MenuItem.js

源代码仓库: https://github.com/SAP/openui5 源代码位置:src\sap.m\src\sap\m\MenuItem.js MenuItem.js 深度解析:在 OpenUI5 菜单体系中的定位、机制与实践价值 一、文件定位与总体结论 MenuItem.js 是 sap.m 库里菜单体系的关键节点文件,它实现了 sap.m.MenuItem 控…...

2026年OpenClaw部署攻略:新手友好部署、配置大模型百炼APIKey、集成Skill详细步骤

2026年OpenClaw部署攻略:新手友好部署、配置大模型百炼APIKey、集成Skill详细步骤。OpenClaw(原Clawdbot)作为2026年主流的AI自动化助理平台,可通过阿里云轻量服务器实现724小时稳定运行,并快速接入钉钉,让…...

实战演练:基于快马平台生成电商全流程自动化测试并与Jenkins集成

今天想和大家分享一个最近用InsCode(快马)平台完成的电商自动化测试实战项目。这个项目模拟了真实电商平台的核心业务流程,从用户注册登录到完成支付的全流程测试,特别适合需要快速搭建自动化测试体系的小伙伴参考。 项目背景与设计思路 电商系统的稳定…...

终极抖音无水印下载指南:如何快速批量获取高质量视频素材

终极抖音无水印下载指南:如何快速批量获取高质量视频素材 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback su…...

Make:目标(Target)构建的详细和依赖项的处理过程(个人总结)

相关文章 Make专栏https://blog.csdn.net/weixin_45791458/category_12383799.html 这段时间在用makefile,所以自己探究了一下make的工作过程,并经过实验总结了一些规律。 对于一个规则的处理如下,首先make会检查规则中的目标文件是否存在和…...

Linux:模式通配符 * 和globstar **(bash4新增)的使用

相关文章 Linux专栏https://blog.csdn.net/weixin_45791458/category_12234591.html 在bash的使用过程中,模式通配符可以说是最常见、也最实用的一类功能。很多时候我们在命令行里处理文件,并不是靠把完整文件名一个个手工敲出来,而是通过ba…...

Topit窗口置顶效率引擎:重新定义Mac多任务工作流

Topit窗口置顶效率引擎:重新定义Mac多任务工作流 【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶 项目地址: https://gitcode.com/gh_mirrors/to/Topit 在信息爆炸的时代,我们每天需要处理的窗…...

Lux编译器完整指南:如何将用户意图智能转化为可视化规范

Lux编译器完整指南:如何将用户意图智能转化为可视化规范 【免费下载链接】lux Automatically visualize your pandas dataframe via a single print! 📊 💡 项目地址: https://gitcode.com/gh_mirrors/lux/lux Lux编译器是Lux数据可视…...

深入解析AdminBSB:Bootstrap 3.x与Material Design完美融合的终极指南

深入解析AdminBSB:Bootstrap 3.x与Material Design完美融合的终极指南 【免费下载链接】AdminBSBMaterialDesign AdminBSB - Free admin panel that is based on Bootstrap 3.x with Material Design 项目地址: https://gitcode.com/gh_mirrors/ad/AdminBSBMateri…...

seo网络优化如何提高网站的转化率

SEO网络优化如何提高网站的转化率 在当前的互联网时代,网站的流量和转化率是衡量企业在网络上竞争力的重要指标。而搜索引擎优化(SEO)网络优化作为提高网站流量和转化率的有效手段,其重要性不言而喻。SEO网络优化究竟能如何有效提…...

AWS容器服务终极指南:如何实现高效微服务治理与API网关集成

AWS容器服务终极指南:如何实现高效微服务治理与API网关集成 【免费下载链接】containers-roadmap This is the public roadmap for AWS container services (ECS, ECR, Fargate, and EKS). 项目地址: https://gitcode.com/gh_mirrors/co/containers-roadmap …...

永久保存QQ空间记忆:GetQzonehistory数据备份工具完全指南

永久保存QQ空间记忆:GetQzonehistory数据备份工具完全指南 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 在数字时代,我们的青春记忆大多存储在社交平台中&…...