Windows 系统下使用 Ollama 离线部署 DeepSeek - R1 模型指南
引言
随着人工智能技术的飞速发展,各类大语言模型层出不穷。DeepSeek - R1 凭借其出色的语言理解和生成能力,受到了广泛关注。而 Ollama 作为一款便捷的模型管理和部署工具,能够帮助我们轻松地在本地环境中部署和使用模型。本文将详细介绍如何在 Windows 系统下使用 Ollama 离线部署 DeepSeek - R1 模型,并展示在 Windows CMD 窗口与 Google 浏览器插件 Page Assist 的交互案例。
一、离线部署的优势
离线部署模型(如 DeepSeek - R1)具有多方面的好处,下面从数据安全、成本控制、响应速度、网络依赖、个性化定制和合规性等多个维度进行分析:
1.1 数据安全与隐私保护
防止数据泄露
- 金融机构:银行在处理客户的敏感财务信息时,如账户余额、交易记录等,如果采用在线模型服务,这些数据需要上传到外部服务器进行分析,存在被黑客攻击导致数据泄露的风险。而通过离线部署模型,银行可以将客户数据和模型都保留在自己的安全服务器中,确保数据不会离开内部网络,有效防止数据在传输和存储过程中被窃取。
- 医疗行业:医院在进行患者病历分析、疾病诊断等工作时,患者的个人健康信息属于高度敏感数据。离线部署模型可以避免患者数据上传到外部,保护患者的隐私。例如,某医院使用离线部署的医疗影像诊断模型,医生在本地设备上直接对患者的X光、CT等影像进行分析,无需将影像数据上传到云端,从而降低了数据泄露的可能性。
符合隐私法规
- 欧盟企业:欧盟的《通用数据保护条例》(GDPR)对企业处理用户数据的方式有严格规定。一家位于欧盟的电商企业,为了遵守 GDPR 法规,选择离线部署客户数据分析模型。这样,企业可以完全掌控客户数据的存储和处理过程,确保数据的使用符合法规要求,避免因数据隐私问题面临巨额罚款。
1.2 成本效益
降低使用成本
- 小型企业:一家小型电商公司每天需要对大量的商品评论进行情感分析,以了解客户的满意度。如果使用在线的情感分析模型服务,按照每次分析的调用量付费,随着业务的增长,费用会不断增加。而该公司选择离线部署开源的情感分析模型,一次性投入硬件和软件成本后,后续使用无需支付额外的调用费用,大大降低了长期的使用成本。
- 科研机构:某科研机构需要对大规模的实验数据进行分析,使用在线数据分析模型的费用高昂。通过离线部署适合的分析模型,科研机构可以利用自己的服务器资源进行数据处理,避免了高额的在线服务费用,将节省下来的资金用于更有价值的科研项目。
减少网络带宽成本
- 工厂车间:一家大型制造企业的工厂车间内,安装了大量的传感器用于实时监测设备的运行状态。如果将这些传感器产生的海量数据上传到云端进行分析,会消耗大量的网络带宽,产生高额的网络费用。通过离线部署数据分析模型,在本地服务器上对数据进行实时处理和分析,不仅减少了网络带宽的使用,还降低了网络费用。
1.3 性能与响应速度
实时响应
- 高频交易:在金融市场的高频交易场景中,交易员需要根据实时的市场数据快速做出交易决策。离线部署的交易模型可以在本地服务器上实时处理市场数据,无需将数据上传到云端等待分析结果,能够在瞬间给出交易建议,确保交易员能够抓住最佳的交易时机。
- 自动驾驶汽车:自动驾驶汽车需要实时处理各种传感器收集到的数据,如摄像头图像、雷达数据等,以做出及时的驾驶决策。离线部署的自动驾驶模型可以在汽车的本地计算单元上快速分析数据,实现实时响应,确保行车安全。
稳定的性能
- 游戏开发:一家游戏开发公司在进行游戏测试时,需要使用人工智能模型对游戏中的角色行为、场景交互等进行实时评估。如果使用在线模型服务,网络延迟可能会导致评估结果不准确,影响游戏的开发进度。通过离线部署模型,开发团队可以在本地稳定地运行模型,不受网络因素的干扰,确保游戏测试的顺利进行。
1.4 网络依赖与可用性
无网络环境使用
- 野外勘探:地质勘探队在偏远的山区进行地质数据采集和分析时,往往处于无网络覆盖的环境。通过离线部署地质数据分析模型,勘探队员可以在本地设备上对采集到的岩石样本、地质结构数据等进行实时分析,无需等待回到有网络的地区再进行处理,大大提高了工作效率。
- 航空飞行:飞机在飞行过程中,需要实时监测各种飞行参数,如发动机状态、飞行姿态等。离线部署的飞行监测模型可以在飞机的机载计算机上独立运行,不受空中网络信号的影响,确保飞行安全。
避免服务中断风险
- 电商促销活动:在电商的大型促销活动期间,如“双11”、“黑色星期五”等,在线服务可能会因为流量过大而出现服务中断的情况。一家电商企业通过离线部署商品推荐模型,在本地服务器上为用户提供商品推荐服务,即使遇到网络故障或外部服务提供商出现问题,也能保证推荐服务的正常运行,避免因服务中断而导致的客户流失和销售损失。
1.5 个性化定制与优化
定制模型参数
- 广告营销:一家广告公司根据不同客户的需求,为其定制个性化的广告投放模型。通过离线部署模型,广告公司可以根据客户的目标受众、广告预算、营销目标等因素,调整模型的参数,如广告投放的时间、渠道、内容等,以实现最佳的广告效果。
- 教育领域:一所学校为了提高学生的学习效果,离线部署了个性化学习辅导模型。学校可以根据学生的学习进度、学习能力、兴趣爱好等因素,对模型的参数进行定制,为每个学生提供个性化的学习建议和辅导内容。
持续优化模型
- 在线教育平台:某在线教育平台通过收集用户的学习数据,如学习时间、答题正确率等,对离线部署的课程推荐模型进行持续优化。平台可以根据用户的反馈和新的数据不断调整模型的算法和参数,提高课程推荐的准确性和个性化程度,为用户提供更好的学习体验。
1.6 合规性与自主性
满足特定合规要求
- 政府机构:政府部门在处理涉及国家安全、公民隐私等敏感信息时,需要严格遵守相关的法规和政策。某政府机构离线部署了信息处理模型,确保数据的存储和处理过程符合国家安全法规和保密要求,保障国家信息安全。
增强企业自主性
- 科技企业:一家科技公司自主研发了一款人工智能模型,并离线部署在自己的服务器上。公司可以根据市场需求和技术发展,自主决定模型的升级和更新,无需依赖外部服务提供商,增强了企业在市场竞争中的自主性和竞争力。
二、准备工作
2.1 硬件要求
为了确保模型能够顺利运行,建议你的计算机具备以下硬件条件:
- CPU:多核处理器,如 Intel Core i7 及以上系列,以提供足够的计算能力。
- 内存:至少 16GB 内存,模型加载和运行过程中会占用大量内存资源。
- 存储:预留至少 20GB 的磁盘空间,用于存储模型文件。
2.2 软件要求
- 操作系统:Windows 10 或 Windows 11。
- Python:建议安装 Python 3.8 及以上版本,并配置好环境变量。
- Ollama:从 Ollama 官方网站 下载适用于 Windows 的安装包(
需要科学上网
)。
三、安装 Ollama
- 运行从官方网站下载的 Ollama 安装包,按照安装向导的提示完成安装。安装过程中可以选择默认的安装路径,也可以根据自己的需求进行自定义设置。
- 安装完成后,打开 Windows 命令提示符(CMD),输入以下命令验证 Ollama 是否安装成功:
ollama --version
如果能够正确显示 Ollama 的版本信息,则说明安装成功。
四、离线部署 DeepSeek - R1 模型
4.1 模型文件导入
进入ollma官网,deepseek已经被被置顶了,很好找:
then,选择对应的模型版本 + 复制Ollama指令,在cmd窗口运行,就会进行模型拉取操作(如果本地之前没有)
以deepseek-r1:7b为例,运行
ollama run deepseek-r1:7b
后 CMD 窗口如下:
4.2 Ollama 本地测试
超级方便,指令不变,再次运行(假设第一步已经走完了pull过程)
ollama run deepseek-r1:1.5b
show case
4.3 启动 Ollama 服务
在导入模型后,需要启动 Ollama 服务,让它监听指定的端口。在 CMD 窗口中输入以下命令:
ollama serve
CMD如下
默认情况下,Ollama 会监听 127.0.0.1:11434
端口。如果该端口被占用,可以通过设置环境变量来指定其他端口,例如:
set OLLAMA_LISTEN=:11436
ollama serve
当然,很有可能你走到这里,运行时会发现如下错误
这一定是因为你已经有在run的ollama进程,打开任务管理器一看,必然是这样的,kill掉后重新运行即可~
4.4 浏览器插件 Page Assist 运行
在成功使用 Ollama 在 Windows 上离线部署 DeepSeek - R1 模型后,我们可以借助 Google 浏览器插件 Page Assist 实现更便捷的交互体验。以下是详细的操作步骤和交互示例。
安装 Page Assist 插件
打开 Google 浏览器,访问 Chrome 网上应用店。在搜索框中输入 “Page Assist”,找到对应的插件并点击“添加至 Chrome”按钮,按照提示完成插件的安装。
配置 Page Assist 以连接本地模型
1. 进入设置页面
安装完成后,在浏览器右上角找到 Page Assist 插件图标并点击,选择“设置”选项,进入插件的设置页面。
2. 设置 API 地址
在设置页面中,找到与 API 地址相关的选项。由于我们是在本地部署的 DeepSeek - R1 模型,且 Ollama 服务默认监听 127.0.0.1:11434
端口,所以将 API 地址设置为 http://localhost:11434/api/generate
。若在启动 Ollama 服务时指定了其他端口,需相应修改该地址。
3. 选择模型
在设置中找到模型选择的位置,将其设置为 deepseek - r1
,确保 Page Assist 调用的是我们部署好的 DeepSeek - R1 模型。
4. 交互示例
五、总结
通过上述步骤,我们成功在 Windows 系统上使用 Ollama 完成了 DeepSeek - R1 的离线部署,并分别在 Windows CMD 窗口和借助 Google 浏览器插件 Page Assist 与模型进行了交互。离线部署使得我们在无网络环境下也能使用强大的语言模型,同时能更好地保护数据隐私。希望本文能帮助你顺利搭建并使用本地的 DeepSeek - R1 模型。
相关文章:

Windows 系统下使用 Ollama 离线部署 DeepSeek - R1 模型指南
引言 随着人工智能技术的飞速发展,各类大语言模型层出不穷。DeepSeek - R1 凭借其出色的语言理解和生成能力,受到了广泛关注。而 Ollama 作为一款便捷的模型管理和部署工具,能够帮助我们轻松地在本地环境中部署和使用模型。本文将详细介绍如…...

性能测试网络风险诊断有哪些?
目录 一、网络定位分析手段 二、sar命令 三、netstat命令 以下是几种常见的网络风险诊断方法 网络连通性检查 带宽与延迟测量 丢包率分析 网络拓扑结构审查 安全设备影响评估 协议层面上的优化 负载均衡器效能检验 云化服务架构下的特殊考量 系统应用之间的交换&am…...

八股文 (一)
文章目录 项目地址一、前端1.1 大文件上传,预览1.2 首页性能优化1.2 流量染色,灰度发布1.3 Websock心跳机制,大数据实时数据优化1.4 Gpu 加速 fps优化1.5 echarts包大小优化和组件封装1.6 前端监控系统1.7 超大虚拟列表卡顿1. 实现2. 相关问题(1) 什么是虚拟化列表,为什么要…...

TVM调度原语完全指南:从入门到微架构级优化
调度原语 在TVM的抽象体系中,调度(Schedule)是对计算过程的时空重塑。每一个原语都是改变计算次序、数据流向或并行策略的手术刀。其核心作用可归纳为: 优化目标 max ( 计算密度 内存延迟 指令开销 ) \text{优化目标} \max…...

c语言进阶(简单的函数 数组 指针 预处理 文件 结构体)
c语言补充 格式 void函数头 {} 中的是函数体 sum函数名 () 参数表 #include <stdio.h>void sum(int begin, int end) {int i;int sum 0;for (i begin ; i < end ; i) {sum i;}printf("%d到%d的和是%d\n", begin, end, sum); …...

终极版已激活!绿话纯净,打开即用!!!
今天我想和大家聊聊一个非常实用的工具——视频转换大师最终版。 视频转换大师终极版,堪称一款全能型的视频制作神器,集视频转换与编辑功能于一体。它搭载的视频增强器技术,能够最大限度地保留原始视频质量,甚至还能实现质量的进…...

Vue.js 什么是 Composition API?
Vue.js 什么是 Composition API? 今天我们来聊聊 Vue 3 引入的一个重要特性:组合式 API(Composition API)。如果你曾在开发复杂的 Vue 组件时感到代码难以维护,那么组合式 API 可能正是你需要的工具。 什么是组合式 …...

MySQL高可用
一、mysql路由 1.利用路由器的连接路由特性,用户可以编写应用程序来连接到路由器,并令路由器使用响应的路由策略来处理连接来使其连接到正确的mysql数据库服务器 2.mysql route的部署方式 需要在所有数据库主机之外再打开一台主机mysql-router 配置mysql…...

30.Word:设计并制作新年贺卡以及标签【30】
目录 NO1.2 NO3邮件合并-信函 NO4邮件合并-标签 NO1.2 另存为/F12:考生文件夹:Word.docx布局→页面设置对话框→页边距:上下左右→纸张:宽度/高度(先调页边距🆗)设计→页面颜色→填充效果→…...

Flink2支持提交StreamGraph到Flink集群
最近研究Flink源码的时候,发现Flink已经支持提交StreamGraph到集群了,替换掉了原来的提交JobGraph。 新增ExecutionPlan接口,将JobGraph和StreamGraph作为实现。 Flink集群Dispatcher也进行了修改,从JobGraph改成了接口Executio…...

大模型本地化部署(Ollama + Open-WebUI)
文章目录 环境准备下载Ollama模型下载下载Open-WebUI 本地化部署的Web图形化界面本地模型联网查询安装 Docker安装 SearXNG本地模型联网查询 环境准备 下载Ollama 下载地址:Ollama网址 安装完成后,命令行里执行命令 ollama -v查看是否安装成功。安装成…...

C++哈希(链地址法)(二)详解
文章目录 1.开放地址法1.1key不能取模的问题1.1.1将字符串转为整型1.1.2将日期类转为整型 2.哈希函数2.1乘法散列法(了解)2.2全域散列法(了解) 3.处理哈希冲突3.1线性探测(挨着找)3.2二次探测(跳…...

IME关于输入法横屏全屏显示问题-Android14
IME关于输入法横屏全屏显示问题-Android14 1、输入法全屏模式updateFullscreenMode1.1 全屏模式判断1.2 全屏模式布局设置 2、应用侧关闭输入法全屏模式2.1 调用输入法的应用设置flag2.2 继承InputMethodService.java的输入法应用覆盖onEvaluateFullscreenMode方法 InputMethod…...

网络工程师 (11)软件生命周期与开发模型
一、软件生命周期 前言 软件生命周期,也称为软件开发周期或软件开发生命周期,是指从软件项目的启动到软件不再被使用为止的整个期间。这个过程可以细分为多个阶段,每个阶段都有其特定的目标、任务和产出物。 1. 问题定义与需求分析 问题定义…...

【人工智能】基于Python的机器翻译系统,从RNN到Transformer的演进与实现
《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 机器翻译(Machine Translation, MT)作为自然语言处理领域的重要应用之一,近年来受到了广泛的关注。在本篇文章中,我们将详细探讨如何使…...

网络工程师 (12)软件开发与测试
一、软件设计 (一)定义与目的 软件设计是从软件需求出发,设计软件的整体结构、功能模块、实现算法及编写代码的过程,旨在确定系统如何完成预定任务。其目标是确保目标系统能够抽象、普遍地完成预定任务,并为后续的软件…...

3.Spring-事务
一、隔离级别: 脏读: 一个事务访问到另外一个事务未提交的数据。 不可重复读: 事务内多次查询相同条件返回的结果不同。 幻读: 一个事务在前后两次查询同一个范围的时候,后一次查询看到了前一次查询没有看到的行。 二…...

Python字典详解:从入门到实践
Python字典详解:从入门到实践 字典(Dictionary)是Python中最重要且最常用的数据结构之一。本文将深入讲解字典的特性、操作方法和实际应用案例。 1. 字典简介 字典是可变的、无序的键值对集合,使用{}创建。每个元素由key: valu…...

91,【7】 攻防世界 web fileclude
进入靶场 <?php // 包含 flag.php 文件 include("flag.php");// 以高亮语法显示当前文件(即包含这段代码的 PHP 文件)的内容 // 方便查看当前代码结构和逻辑,常用于调试或给解题者提示代码信息 highlight_file(__FILE__);// 检…...

41【文件名的编码规则】
我们在学习的过程中,写出数据或读取数据时需要考虑编码类型 火山采用:UTF-16 易语言采用:GBK php采用:UTF-8 那么我们写出的文件名应该是何种编码的?比如火山程序向本地写出一个“测试.txt”,理论上这个“测…...

蓝桥杯备赛经验帖
蓝桥杯备赛经验帖 作者:blue 时间:2025.2.1 文章目录 蓝桥杯备赛经验帖1.为什么有这篇文章2.赛制3.比赛流程4.如何准备5.其他建议6.一些感悟 1.为什么有这篇文章 笔者近期发现,观看我写的两道第十五届蓝桥杯题解的人数逐渐增多…...

一文大白话讲清楚webpack基本使用——17——Tree Shaking
文章目录 一文大白话讲清楚webpack基本使用——17——Tree Shaking1. 建议按文章顺序从头看,一看到底,豁然开朗2. 啥叫Tree Shaking3. 什么是死代码,怎么来的3. Tree Shaking的流程3.1 标记3.2 利用Terser摇起来 4. 具体使用方式4.1 适用前提…...

【C++ 区间位运算】3209. 子数组按位与值为 K 的数目|2050
本文涉及知识点 位运算、状态压缩、枚举子集汇总 LeetCode3209. 子数组按位与值为 K 的数目 给你一个整数数组 nums 和一个整数 k ,请你返回 nums 中有多少个子数组 满足:子数组中所有元素按位 AND 的结果为 k 。 示例 1: 输入:…...

8 比例缩放(scale.rs)
scale.rs代码是几何变换库euclid中典型的数据结构和方法的例子,用于处理二维和三维空间中的缩放变换。 一、scale.rs文件源码 //! A type-checked scaling factor between units.use crate::num::One;use crate::approxord::{max, min}; use crate::{Box2D, Box3D…...

二分 机器人的跳跃问题
二段性:找到一个值,大于此值的时候都成立,小于的时候都不成立 更新的方式只有两种,左边的mid更新不需要1;右边的mid更新需要1 //对能量进行二分,确定能量的范围 //特判防止溢出int #include<bits/stdc.h> using…...

Hive:复杂数据类型之Map函数
Map函数 是Hive里面的一种复杂数据类型, 用于存储键值对集合。Map中的键和值可以是基础类型或复合类型,这使得Map在处理需要关联存储信息的数据时非常有用。 定义map时,需声明2个属性: key 和 value , map中是 key value 组成一个元素 key-value, key必须为原始类…...

R 字符串:深入理解与高效应用
R 字符串:深入理解与高效应用 引言 在R语言中,字符串是数据处理和编程中不可或缺的一部分。无论是数据清洗、数据转换还是数据分析,字符串的处理都是基础技能。本文将深入探讨R语言中的字符串概念,包括其基本操作、常见函数以及高效应用方法。 字符串基本概念 字符串定…...

设计模式Python版 桥接模式
文章目录 前言一、桥接模式二、桥接模式示例三、桥接模式与适配器模式的联用 前言 GOF设计模式分三大类: 创建型模式:关注对象的创建过程,包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式&…...

记5(一元逻辑回归+线性分类器+多元逻辑回归
目录 1、一元逻辑回归2、线性可分&线性不可分3、Iris数据集实现多元逻辑回归4、绘制分类图5、鸢尾花分类图6、多分类问题:(softmax回归)6.1、编码:自然顺序码、独热编码、独冷编码6.2、二/多分类问题:6.3、softmax…...

【Python】第七弹---Python基础进阶:深入字典操作与文件处理技巧
✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】【Linux系统编程】【MySQL】【Python】 目录 1、字典 1.1、字典是什么 1.2、创建字典 1.3、查找 key 1.4、新增/修改元素 1.5、删除元素 1.6、遍历…...