当前位置: 首页 > article >正文

24GB 内存 M4 运行本地模型:虽有局限但乐趣与优势并存!

在配备 24GB 内存的 M4 上运行本地模型2026 年 5 月 10 日阅读时长 13 分钟。涉及 Elixir、大语言模型LLM、通义千问Qwen、LLM Studio。断断续续尝试在本地运行模型一段时间后终于找到可行方案。虽输出效果不及最先进SOTA模型但能让本地模型完成基本任务、用于研究和规划这种兴奋感足以弥补差距而且运行本地模型无需联网还能减少对美国大型科技公司的依赖。搭建环境不易搭建运行本地模型的环境并不轻松。首先要选择运行模型的方式像 [Ollama]、[llama.cpp] 或者 [LM Studio]每种方式都有特点和局限性并非所有模型都能在这些工具中使用。接着要挑选合适的模型需选既能在内存中运行又能为日常使用的 Electron 应用留出足够空间的最佳模型且模型最好有至少 64K 的上下文窗口理想情况是达到 128K 或更大。最近尝试了 Qwen 3.6 Q3、GPT - OSS 20B、Devstral Small 24B理论上能在内存中运行但实际无法正常工作Gemma 4B 运行没问题但工具使用表现不佳。此外还有大量配置选项需调整。从常见参数如温度到晦涩选项如 K 缓存量化类型很多工具提供基本推荐选项但合适配置会因是否启用思考模式等因素而异。通义千问 3.5 - 9B4b 量化表现出色qwen3.5 - 9bq4_k_s 是目前运行效果最好的模型。在 LM Studio 上运行启用思考模式时每秒约能输出 40 个 token能成功使用工具有 128K 的上下文窗口。与 SOTA 模型相比它易分心、会陷入循环、可能误解问题等。但对于配备 24GB 内存的 Macbook Pro 来说运行时还能为其他程序留空间表现相当不错以下是思考模式和编码工作的推荐设置精确编码任务如 Web 开发的思考模式温度temperature 0.6核采样概率top_p 0.95采样数量top_k 20最小概率min_p 0.0存在惩罚presence_penalty 0.0重复惩罚repetition_penalty 1.0要启用思考模式需选择模型进入配置页面滚动到推理Inference选项卡底部在提示模板Prompt Template中添加 {% - set enable_thinking true %}。通过 [pi] 和 [OpenCode] 使用这个模型但还没决定更喜欢哪个。Pi 响应速度更快虽欣赏其自动构建工具和丰富自定义功能但希望它提供合理默认设置感觉调整 Pi 配置花费的时间可能比实际项目开发时间还多Pi 设置以下是 ~/.pi/agent/models.json 的内容{providers: {lmstudio: {baseUrl: http://localhost:1234/v1,api: openai - completions,apiKey: lm - studio,models: [{id: qwen3.5 - 9bq4_k_s,reasoning: true,compat: { thinkingFormat: qwen - chat - template }}]}}}若要隐藏干扰性的思考内容可在 ~/.pi/agent/settings.json 中添加 hideThinkingBlock: true。OpenCode 设置~/.config/opencode/opencode.json 的内容如下{$schema: https://opencode.ai/config.json,provider: {lmstudio: {npm: ai - sdk/openai - compatible,name: LM Studio (本地),options: {baseURL: http://127.0.0.1:1234/v1},models: {qwen3.5 - 9bq4_k_s: {name: 通义千问 3.5 9B Q4_K_S,tools: true,context_length: 131072,max_tokens: 32768}}}},model: lmstudio/qwen3.5 - 9bq4_k_s}与 SOTA 模型的比较像通义千问 3.5 9BQ4这样的模型远不能像 SOTA 模型那样长时间独立解决复杂问题。让它一次性构建完整应用程序不现实只会浪费时间没结果。不过采用更交互式工作流程更有效即逐步与模型清晰沟通并给予大量指导。很多人可能觉得这样做没意义但实际上这能让人更投入。使用 SOTA 模型的弊端是容易让人把所有认知工作交给它们即便试图避免也难。使用本地模型时需承担更多思考和规划工作更具体地提问题但它仍可充当研究助手、“橡皮鸭调试法”对象以及能瞬间回忆大量编程语言细节和命令行调用的专家。虽无法带来 10 倍生产力提升但有一定作用且有趣。示例展示示例 1想将 Elixir 代码检查工具 credo 更新到最新版本代码出现警告。让通义千问帮忙查看它给出了详细解决方案我运行 mix credo --strict 并提出解决方案不要直接编辑代码通义千问Credo 警告测试文件中有 4 个警告。问题在于使用 length/1 来检查列表是否非空。Credo 建议将列表与空列表进行比较。警告信息如下1. test/jola_dev_web/controllers/blog_controller_test.exs:11- assert length(conn.assigns.posts) 02. test/jola_dev_web/controllers/blog_controller_test.exs:22- assert length(conn.assigns.posts) 03. test/jola_dev/blog_test.exs:10- assert length(posts) 04. test/jola_dev/blog_test.exs:23- assert length(tags) 0解决方案将每个 length(list) 0 替换为 list ! []blog_controller_test.exs:# 第 11 行assert conn.assigns.posts ! []# 第 22 行assert conn.assigns.posts ! []blog_test.exs:# 第 10 行assert posts ! []# 第 23 行assert tags ! []这样在 Elixir 中更符合习惯并且避免了计算列表长度的开销。让通义千问进行编辑它同时进行了 4 处编辑很干净利落。总体来说这是简单任务自己也可在终端和编辑器间切换获取行号编辑使用模型更方便。示例 2更新一些依赖项后Dependabot 的拉取请求PR出现 Git 冲突Dependabot 拒绝变基。将代码拉下来变基后让通义千问帮忙查看。这是简单冲突只需选每个依赖项较新版本模型也识别出这点。它给出了几种选择我能看到冲突。情况如下HEAD当前分支- sentry: 13.0.1- tailwind: 0.3.1另一方正在变基的提交- sentry: 12.0.3- tailwind: 0.4.1依赖项更新存在分歧。你有以下几种选择选项 1同时接受两个更新推荐- 保留 HEAD 中的 sentry 13.0.1- 保留另一方的 tailwind 0.4.1- 这样可以获得两个依赖项的最新版本选项 2仅接受 sentry 更新- 保留 sentry 13.0.1- 保留 tailwind 0.3.1选项 3仅接受 tailwind 更新- 保留 sentry 12.0.3- 保留 tailwind 0.4.1你想采用哪种方法然而要求它进行更改时它忘记编辑只试图添加更改并继续变基操作冲突标记仍存在。它还没意识到 git rebase --continue 会打开编辑器导致 OpenCode 卡住不过这可能是个例。总结大语言模型LLM非常灵活本地模型也能完成很多任务想象力就是边界。本地模型虽有明显权衡之处但也有吸引人的优点无需联网可在飞机上工作成本仅限于使用的电量无需订阅费用开源模型公司在环境影响方面远不及大型公司使用自己的硬件减少了数据中心的使用摆弄这些模型很有趣。大语言模型对世界产生巨大影响虽有很多不积极的影响但显然会一直存在。尝试使用本地模型是更可持续、更积极的与这项技术互动的方式。即便它偶尔出错也很有趣那你是否也想尝试一下本地模型呢

相关文章:

24GB 内存 M4 运行本地模型:虽有局限但乐趣与优势并存!

在配备 24GB 内存的 M4 上运行本地模型 2026 年 5 月 10 日,阅读时长 13 分钟。涉及 Elixir、大语言模型(LLM)、通义千问(Qwen)、LLM Studio。断断续续尝试在本地运行模型一段时间后,终于找到可行方案。虽输…...

如何永久保存微信聊天记录?WeChatExporter一站式解决方案

如何永久保存微信聊天记录?WeChatExporter一站式解决方案 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 在数字时代,微信聊天记录承载着我们的工…...

USB枚举过程深度解析:主机是如何‘读懂’你的配置描述符的?

USB枚举过程深度解析:主机是如何‘读懂’你的配置描述符的? 当我们将一个USB设备插入电脑时,短短几秒钟内,主机和设备之间已经完成了数十次数据交换。这个过程被称为枚举(Enumeration),是USB协议…...

MySQL 如何正确实现“随机采样”

在开发英语学习或社交应用时,随机展示单词或消息是一个高频需求。然而,看似简单的“随机”逻辑,如果实现方式不当,会随着数据量的增长演变为系统瓶颈 。 1. 性能陷阱:order by rand() 最直观的写法是 select word from…...

英雄联盟智能助手League Akari:重新定义你的游戏体验边界

英雄联盟智能助手League Akari:重新定义你的游戏体验边界 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 在英雄联盟的竞技世界中&…...

OpenOCD实战:从源码编译到JTAG调试RISC-V平台

1. OpenOCD与RISC-V调试基础 第一次接触OpenOCD调试RISC-V芯片时,我对着开发板上的JTAG接口发了半天呆。作为嵌入式开发者,我们都经历过这种从零搭建调试环境的阵痛期。OpenOCD就像一位硬件调试的瑞士军刀,它能通过JTAG接口与各种处理器架构对…...

B站缓存视频终极转换指南:3分钟将m4s文件无损转为通用MP4格式

B站缓存视频终极转换指南:3分钟将m4s文件无损转为通用MP4格式 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾经遇到过这样的…...

Windows Cleaner终极指南:彻底告别C盘爆红的免费系统优化神器

Windows Cleaner终极指南:彻底告别C盘爆红的免费系统优化神器 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner Windows Cleaner是一款专为Windows系统设…...

绝区零自动化助手:5分钟掌握全自动游戏任务管理

绝区零自动化助手:5分钟掌握全自动游戏任务管理 【免费下载链接】ZenlessZoneZero-OneDragon 绝区零 一条龙 | 全自动 | 自动闪避 | 自动每日 | 自动空洞 | 支持手柄 项目地址: https://gitcode.com/gh_mirrors/ze/ZenlessZoneZero-OneDragon 绝区零一条龙是…...

终极指南:如何彻底解锁《原神》60帧限制?完整免费解决方案

终极指南:如何彻底解锁《原神》60帧限制?完整免费解决方案 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 你是一个文章写手,你负责为开源项目写专业易…...

如何用猫抓浏览器扩展轻松捕获在线视频资源?一个实用工具的全方位指南

如何用猫抓浏览器扩展轻松捕获在线视频资源?一个实用工具的全方位指南 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 当你在浏览器中观…...

我的世界手机版烦人的村民整合包下载基岩国际版2026最新版

在《我的世界》庞大的模组生态中,烦人的村民整合包(Annoying Villagers) 凭借颠覆性的 NPC 设定、硬核战斗机制与深度剧情互动,成为 Java 版最具影响力的高难度生存整合包之一。由 Pugilist_Steve 主导开发,最新 6.0 版…...

夜莺传说服务器联机开服教程

本教程转载莱卡云游戏服务器的莱卡云:夜莺传说开服教程【百度搜索莱卡云开服可搜到】1、购买后登录服务器在你的莱卡云账户左侧栏目中点击产品服务,再点游戏服务器,再选择你的服务器点击操作进入服务器产品详情页面后,先点重置密码…...

Hitboxer终极指南:3分钟解决游戏按键冲突,让你的键盘操作瞬间职业化

Hitboxer终极指南:3分钟解决游戏按键冲突,让你的键盘操作瞬间职业化 【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否在激烈的游戏对战中遇到过这样的困扰:明明同时按下…...

别再死记硬背了!用‘知识卡片+思维导图’法搞定离散数学里的命题、谓词与代数系统

知识卡片与思维导图:离散数学的高效学习革命 离散数学常被学生称为"天书"——命题逻辑的符号迷宫、谓词逻辑的量化陷阱、代数系统的抽象森林,每个概念都像一座孤岛。传统线性笔记法让这些知识点在脑海中如散沙般难以聚合,这正是大多…...

用LDAP Browser连接OpenLDAP时,这3个配置细节坑了我一整天

用LDAP Browser连接OpenLDAP时,这3个配置细节坑了我一整天 第一次用LDAP Browser连接OpenLDAP服务器时,我本以为照着教程五分钟就能搞定,结果硬是折腾了一整天。明明服务端已经正常启动,客户端工具也装好了,但就是连不…...

别再死记硬背了!用Python代码动画演示组合数11个核心性质(附完整源码)

用Python动画拆解组合数:11个核心性质的动态演绎 数学公式总是让人望而生畏?当组合数学遇上Python动画,抽象概念瞬间变得鲜活起来。这不是又一篇枯燥的公式推导文章,而是一场用代码演绎数学之美的视觉盛宴。我们将用matplotlib和…...

在飞腾FT-2000/4与麒麟V10上源码编译VLC:从依赖解析到播放验证的完整实践

1. 环境准备与依赖解析 在飞腾FT-2000/4处理器和麒麟V10系统上编译VLC,首先需要搭建合适的开发环境。我实测发现,麒麟V10自带的软件源有时无法满足所有依赖需求,需要手动补充配置。建议先执行以下基础命令更新系统: sudo yum up…...

企业上云选型:四家主流云厂商的硬指标对比

在数字化转型进入深水区的2026年,企业IT部门的任务已不再是简单的“资源扩容”,而是如何在保障业务连续性的前提下,实现安全免运维与成本控制的完美平衡。 针对官网、小程序等互联网业务,各大公有云厂商均有成熟方案。但当涉及到…...

YOLOv5 COCO数据集 实战训练全流程解析 | 【从零到一】

1. 环境准备:从零搭建YOLOv5训练环境 第一次接触YOLOv5时,我最头疼的就是环境配置。记得当时为了一个CUDA版本问题折腾了整整两天,现在回想起来其实只要按步骤来就能避免90%的坑。下面是我总结的最稳环境搭建方案: 首先确保你的机…...

别再硬算公式了!用Excel搞定STM32 NTC测温的ADC查表法(附完整表格)

用Excel玩转STM32 NTC测温:查表法实战指南 嵌入式开发中,温度测量是个永恒的话题。NTC热敏电阻因其成本低廉、响应迅速,成为工程师们的首选传感器。但每次项目都要重新推导温度计算公式,不仅耗时费力,还容易在数学转换…...

从 AI 电影到小说:《凰标》延续《第一大道》的东方梦@凤凰标志

科技为翼,文脉为魂; 大道开路,凰标定局。一、时代之问:当AI沦为流量收割机,谁来守护东方文脉? AI 正以惊人的速度渗透文娱产业,却多数被资本用作「快餐内容」的流水线。 海棠山铁哥反其道而行—…...

从一张‘正常’图片到服务器沦陷:文件包含漏洞如何让图片马‘活’过来?

从一张“正常”图片到服务器沦陷:揭秘文件包含漏洞的致命组合攻击 当你深夜检查服务器日志时,发现有人上传了一张普通的风景图。文件头校验通过,MIME类型正确,甚至预览也显示正常。但三天后,这张“图片”却成为攻击者控…...

如何突破百度网盘下载限速?这款开源工具让你重获高速下载自由

如何突破百度网盘下载限速?这款开源工具让你重获高速下载自由 【免费下载链接】baidupcs-web 项目地址: https://gitcode.com/gh_mirrors/ba/baidupcs-web 还在为百度网盘那令人绝望的下载速度而苦恼吗?当你看着进度条缓慢爬行,大文件…...

避开这些坑!用Vivado FIFO IP核做跨时钟域处理的5个实战细节

避开这些坑!用Vivado FIFO IP核做跨时钟域处理的5个实战细节 在FPGA设计中,跨时钟域(CDC)数据传输一直是工程师们面临的棘手问题。Xilinx Vivado提供的FIFO IP核因其稳定性和易用性,成为处理CDC问题的首选方案。然而&a…...

背包九讲(C++)

目录 背包问题 1.0/1背包 2.完全背包 3.多重背包 4.分组背包 5.混合背包问题 6.背包问题求具体方案 7.背包问题求方案数 8.二维费用的背包问题 9.有依赖的背包问题 背包问题 任何背包问题都有01背包的影子,甚至均可以化为01背包的问题(特殊性)&#xff0…...

2026年电力电缆品牌梳理多维度适配项目选型需求

随着双碳目标落地与电力基础设施完善,电力电缆作为电力传输的重要载体,市场需求持续释放,产品向高安全、长寿命、广适配方向发展。本文基于市场应用与企业实力,整理电力电缆品牌信息,助力项目合理选型。一、2026年电力…...

如何学习java?

目录 一. 初识Java 1. Java语⾔概述 1.1 Java是什么 1.2 什么是JavaSE?什么是JavaEE? JavaSE(JavaStandardEdition): JavaEE(JavaEnterprise Edition): 主要区别: 1.3 Java语⾔重要性 1.4 Java语⾔发展简史 1.5 Java语⾔特性 1.6 Java开发环境安装 1. …...

英雄联盟Akari助手:你的智能游戏伴侣完整指南,轻松提升游戏体验 [特殊字符]

英雄联盟Akari助手:你的智能游戏伴侣完整指南,轻松提升游戏体验 🚀 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolk…...

新加坡高校 Canvas 攻击事件影响评估与安全治理研究

摘要 2026 年 5 月发生的 Canvas 学习平台全球供应链攻击事件,对新加坡国立大学、新加坡社科大学、新加坡管理学院等高校造成服务中断与数据泄露风险,成为教育数字化场景下第三方平台安全风险的典型案例。本次攻击由 Shiny Hunters 组织实施,…...