当前位置: 首页 > news >正文

在Mac mini M4上部署DeepSeek R1本地大模型

在Mac mini M4上部署DeepSeek R1本地大模型

安装ollama

本地部署,我们可以通过Ollama来进行安装

Ollama 官方版:【点击前往】
Web UI 控制端【点击安装】

如何在MacOS上更换Ollama的模型位置

默认安装时,OLLAMA_MODELS 位置在"~/.ollama/models"

只需要通过更改Mac的环境变量,并且重启Ollama就可以达到目的。

launchctl setenv OLLAMA_MODELS “你的模型文件夹路径”
举例如下:我有一个共享磁盘目录,希望把大文件放在这里

launchctl setenv OLLAMA_MODELS “/Volumes/192.168.2.127/AI/Ollama/mac/ollama_models”

~/.ollama/models是一个隐藏文件夹,你需要通过Command⌘+Shift⇧+。来让它显形。或者直接执行下方命令(确认后可以删除之前文件夹中内容)。

cp -R ~/.ollama/models 你的模型文件夹路径
重新启动Ollama APP

下载大模型文件Mac mini M4系统老是重置问题的解决

我用windows系统下载好文件以后从E:\AI\Ollama\blobs复制到E:\AI\Ollama\mac\ollama_models\blobs即mac系统的/Volumes/192.168.2.127/AI/Ollama/mac/ollama_models/blobs

C:\Users\Administrator>ollama run deepseek-r1:7b
pulling manifest
pulling 96c415656d37... 100% ▕████████████████████████████████████████████████████████▏ 4.7 GB
pulling 369ca498f347... 100% ▕████████████████████████████████████████████████████████▏  387 B
pulling 6e4c38e1172f... 100% ▕████████████████████████████████████████████████████████▏ 1.1 KB
pulling f4d24e9138dd... 100% ▕████████████████████████████████████████████████████████▏  148 B
pulling 40fb844194b2... 100% ▕████████████████████████████████████████████████████████▏  487 B
verifying sha256 digest
writing manifest
success
holyeyes@holyeyesdeMini ~ % ollama run deepseek-r1:7b
pulling manifest 
pulling 96c415656d37... 100% ▕████████████████▏ 4.7 GB                         
pulling 369ca498f347... 100% ▕████████████████▏  387 B                         
pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB                         
pulling f4d24e9138dd... 100% ▕████████████████▏  148 B                         
pulling 40fb844194b2... 100% ▕████████████████▏  487 B                         
verifying sha256 digest 
writing manifest 
success 

使用docker方式安装webui

安装docker

根据电脑芯片选择下载版本,我选择的是​Download for Mac - Apple Silicon

在这里插入图片描述

安装运行open-webui

sudo docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
holyeyes@holyeyesdeMini ~ % sudo docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
Password:
Unable to find image 'ghcr.io/open-webui/open-webui:main' locally
2025/02/02 14:39:46 must use ASL logging (which requires CGO) if running as root
main: Pulling from open-webui/open-webui
7ce705000c39: Pull complete 
d02d1a1ced20: Pull complete 
8c2bfb64ec8e: Pull complete 
1c510bbba845: Pull complete 
c1b66c7e5efa: Pull complete 
4f4fb700ef54: Pull complete 
cef437bcef5f: Pull complete 
77456adf2b22: Pull complete 
815479942156: Pull complete 
293c52404a14: Pull complete 
b7fca0b068c8: Pull complete 
b9defacaa06c: Pull complete 
690490b2e7dc: Pull complete 
b5f1de319771: Pull complete 
40635cddd89d: Pull complete 
Digest: sha256:b2c83b5c7b9b244999307b4b1c0e195d41268f3d3a62b84b470c0cea5c5743fd
Status: Downloaded newer image for ghcr.io/open-webui/open-webui:main
6acb84b71300f3b5d5341ddabb7647d03e2523f4d792aac8796af87c39a14e3f
holyeyes@holyeyesdeMini ~ % 

webui两种安装方式对比测试发现docker方式的要好

webui插件方式回答问题错误

在这里插入图片描述

docker方式回答问题正确

在这里插入图片描述

参考:

https://www.5bei.cn/macminim4-local-running-model-ollamallamacomfyu.html#2024-12-11_1028tui_jian_zhong_xin_guan_kan

https://blog.csdn.net/weixin_44336445/article/details/145400324

https://blog.csdn.net/weixin_44626085/article/details/145407887

相关文章:

在Mac mini M4上部署DeepSeek R1本地大模型

在Mac mini M4上部署DeepSeek R1本地大模型 安装ollama 本地部署,我们可以通过Ollama来进行安装 Ollama 官方版:【点击前往】 Web UI 控制端【点击安装】 如何在MacOS上更换Ollama的模型位置 默认安装时,OLLAMA_MODELS 位置在"~/.o…...

【电脑系统】电脑突然(蓝屏)卡死发出刺耳声音

文章目录 前言问题描述软件解决方案尝试硬件解决方案尝试参考文献 前言 在 更换硬盘 时遇到的问题,有时候只有卡死没有蓝屏 问题描述 更换硬盘后,电脑用一会就卡死,蓝屏,显示蓝屏代码 UNEXPECTED_STORE_EXCEPTION 软件解决方案…...

Docker使用指南(二)——容器相关操作详解(实战案例教学,创建/使用/停止/删除)

目录 1.容器操作相关命令​编辑 案例一: 案例二: 容器常用命令总结: 1.查看容器状态: 2.删除容器: 3.进入容器: 二、Docker基本操作——容器篇 1.容器操作相关命令 下面我们用两个案例来具体实操一…...

Java中的常见对象类型解析

在Java开发中,数据的组织和传递是一个重要的概念。为了确保代码的清晰性、可维护性和可扩展性,我们通常会根据不同的用途,设计和使用不同类型的对象。这些对象的作用各不相同,但它们共同为构建高效、模块化的软件架构提供支持。 …...

Dijkstra算法解析

Dijkstra算法,用于求解图中从一个起点到其他所有节点的最短路径。解决单源最短路径问题的有效方法。 条件 有向 带权路径 时间复杂度 O(n平方) 方法步骤 1 把图上的点分为两个集合 要求的起点 和除了起点之外的点 。能直达的写上权值 不…...

C++ Primer 多维数组

欢迎阅读我的 【CPrimer】专栏 专栏简介:本专栏主要面向C初学者,解释C的一些基本概念和基础语言特性,涉及C标准库的用法,面向对象特性,泛型特性高级用法。通过使用标准库中定义的抽象设施,使你更加适应高级…...

maven mysql jdk nvm node npm 环境安装

安装JDK 1.8 11 环境 maven环境安装 打开网站 下载 下载zip格式 解压 自己创建一个maven库 以后在idea 使用maven时候重新设置一下 这三个地方分别设置 这时候maven才算设置好 nvm 管理 npm nodejs nvm下载 安装 Releases coreybutler/nvm-windows GitHub 一键安装且若有…...

SQL Server中RANK()函数:处理并列排名与自然跳号

RANK()是SQL Server的窗口函数,为结果集中的行生成排名。当出现相同值时,后续排名会跳过被占用的名次,形成自然间隔。与DENSE_RANK()的关键区别在于是否允许排名值连续。 语法: RANK() OVER ([PARTITION BY 分组列]ORDER BY 排序…...

如何运行Composer安装PHP包 安装JWT库

1. 使用Composer Composer是PHP的依赖管理工具,它允许你轻松地安装和管理PHP包。对于JWT,你可以使用firebase/php-jwt这个库,这是由Firebase提供的官方库。 安装Composer(如果你还没有安装的话): 访问Co…...

最新功能发布!AllData数据中台核心菜单汇总

🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。 ✨奥零数据科技官网:http://www.aolingdata.com ✨AllData开源项目:https://github.com/alldatacenter/…...

【OS】AUTOSAR架构下的Interrupt详解(上篇)

目录 前言 正文 1.中断概念分析 1.1 中断处理API 1.2 中断级别 1.3 中断向量表 1.4 二类中断的嵌套 1.4.1概述 1.4.2激活 1.5一类中断 1.5.1一类中断的实现 1.5.2一类中断的嵌套 1.5.3在StartOS之前的1类ISR 1.5.4使用1类中断时的注意事项 1.6中断源的初始化 1.…...

大数据挖掘--两个角度理解相似度计算理论

文章目录 0 相似度计算可以转换成什么问题1 集合相似度的应用1.1 集合相似度1.1文档相似度1.2 协同过滤用户-用户协同过滤物品-物品协同过滤 1.2 文档的shingling--将文档表示成集合1.2.1 k-shingling1.2.2 基于停用词的 shingling 1.3 最小哈希签名1.4 局部敏感哈希算法&#…...

Win10微软商店重新安装指南

Win10微软商店重新安装指南 在使用Windows 10操作系统的过程中,微软商店(Microsoft Store)作为官方提供的应用下载平台,一直是用户获取和安装各类应用程序的重要渠道。然而,有时用户可能会遇到微软商店无法找到或误删的情况,这无疑给软件的安装和管理带来了不便。本文将…...

操作系统和中间件的信息收集

在浏览器中收集操作系统与中间件信息时,主要通过客户端JavaScript(用于操作系统/浏览器信息)和服务器端脚本(用于中间件信息)实现。以下是分步指南: 一、客户端操作系统信息收集(JavaScript&am…...

项目集成Spring Security授权部分

一、需求分析 业务背景 当前项目采用前后端分离架构,后端需要对接口访问进行严格控制,防止未授权访问。鉴于系统需要支持高并发与分布式部署,采用无状态认证方式显得尤为重要。 核心需求 无状态认证:使用 JWT 作为令牌&#xff0…...

5. k8s二进制集群之ETCD集群部署

下载etcd安装包创建etcd配置文件准备证书文件和etcd存储目录ETCD证书文件安装(分别对应指定节点)创建证书服务的配置文件启动etcd集群验证etcd集群状态继续上一篇文章《k8s二进制集群之ETCD集群证书生成》下面介绍一下etcd证书生成配置。 下载etcd安装包 https://github.com…...

MV结构下设置Qt表格的代理

目录 预备知识 模型 关联 刷新 示例 代理 模型 界面 结果 完整资料见: 所谓MV结构,是“model-view”(模型-视图)的简称。也就是说,表格的数据保存在model中,而视图由view实现。在我前面的很多博客…...

二维数组 C++ 蓝桥杯

1.稀疏矩阵 #include<iostream> using namespace std;const int N 1e4 10; int a[N][N];int main() {int n, m; cin >> n >> m;for (int i 1; i < n; i) {for (int j 1; j < m; j) {cin >> a[i][j];}}for (int j m; j > 1; j--) {for (i…...

【Linux】文件描述符

初识文件 之前我们认识到当我们进行创建出一个空文件在磁盘上也是占用一部分空间的&#xff0c;因为文件的组成是由文件内容和文件属性共同构成。 文件内容属性&#xff0c;那我们对文件进行操作无外乎就是对内容和属性两个方面进行操作。 文件在磁盘上进行存储&#xff0c;…...

大语言模型的个性化综述 ——《Personalization of Large Language Models: A Survey》

摘要&#xff1a; 本文深入解读了论文“Personalization of Large Language Models: A Survey”&#xff0c;对大语言模型&#xff08;LLMs&#xff09;的个性化领域进行了全面剖析。通过详细阐述个性化的基础概念、分类体系、技术方法、评估指标以及应用实践&#xff0c;揭示了…...

给 Agent 用的搜索:Cloudflare AI Search 是什么,怎么工作的

原文&#xff1a;AI Search: the search primitive for your agents 发布时间&#xff1a;2026 年 4 月 16 日 作者&#xff1a;Gabriel Massadas、Miguel Cardoso、Anni Wang 每个 Agent 都需要搜索&#xff0c;但自己搭很麻烦 编码 Agent 要检索数百万个文件&#xff0c;客服…...

为 Agent 重新设计的 Git:Cloudflare Artifacts 是什么,怎么工作的

原文&#xff1a;Artifacts: versioned storage that speaks Git 发布时间&#xff1a;2026 年 4 月 16 日 作者&#xff1a;Dillon Mulroy、Matt Carey、Matt Silverlock 一个规模问题 有一个被反复引用的预测&#xff1a;未来 5 年内&#xff0c;人类将写出比过去整个编程历…...

DeepSeek API Gateway与大模型推理服务深度协同:如何实现Token级流控、异步响应封装、Streaming SSE自动保活?

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;DeepSeek API Gateway架构全景与核心定位 DeepSeek API Gateway 是面向大模型服务的高性能、可扩展网关系统&#xff0c;承担请求路由、认证鉴权、流量控制、协议转换与可观测性聚合等关键职责。它并非…...

LSLib:让《神界原罪》和《博德之门3》MOD制作变得高效完整的实用指南

LSLib&#xff1a;让《神界原罪》和《博德之门3》MOD制作变得高效完整的实用指南 【免费下载链接】lslib Tools for manipulating Divinity Original Sin and Baldurs Gate 3 files 项目地址: https://gitcode.com/gh_mirrors/ls/lslib 你是否曾想为《神界原罪》或《博德…...

使用 SciPy 求解零和博弈纳什均衡的正确建模与实现

...

保姆级教程:小白也能轻松上手 AI 硬件

大家好&#xff0c;我是siuser小伟如果你是一个小白&#xff0c;又想玩一下硬件的话&#xff0c;那我一定推荐你去接触 AI 小智。因为他们的生态非常好&#xff0c;教程非常详细&#xff0c;你也可以跑一个专属于你自己的 AI 硬件。这篇文章专门写给第一次部署小智 Go 后端的人…...

告别Arduino IDE:用Python玩转ESP8266,保姆级Micropython固件烧录与点灯实战

从Arduino到Micropython&#xff1a;用Python解锁ESP8266的物联网潜能 当硬件爱好者第一次接触Arduino时&#xff0c;往往会被其简单的开发方式所吸引。但随着项目复杂度提升&#xff0c;C/C的编译等待、内存管理和语法冗长开始成为创新路上的绊脚石。这就是为什么越来越多的开…...

BurstGPT:大语言模型驱动高性能计算,实现自然语言科学仿真

1. 项目概述&#xff1a;当大语言模型遇上高性能计算最近在AI和HPC&#xff08;高性能计算&#xff09;的交叉领域&#xff0c;一个名为BurstGPT的项目引起了我的注意。乍一看这个标题&#xff0c;你可能会觉得有点“缝合怪”的味道——Burst通常指代计算资源的突发式使用或高性…...

Docker Hub命令行工具hub-tool:镜像仓库自动化管理的终极利器

1. 项目概述&#xff1a;一个被低估的Docker Hub命令行利器 如果你日常工作中需要和Docker Hub打交道&#xff0c;无论是管理个人镜像、处理团队仓库&#xff0c;还是需要自动化镜像的推送、拉取和清理&#xff0c;那么你很可能已经受够了在浏览器和命令行之间反复横跳的繁琐。…...

5分钟掌握HunterPie:解决《怪物猎人:世界》战斗信息盲区的终极指南

5分钟掌握HunterPie&#xff1a;解决《怪物猎人&#xff1a;世界》战斗信息盲区的终极指南 【免费下载链接】HunterPie-legacy A complete, modern and clean overlay with Discord Rich Presence integration for Monster Hunter: World. 项目地址: https://gitcode.com/gh_…...