当前位置: 首页 > news >正文

从 0 开始本地部署 DeepSeek:详细步骤 + 避坑指南 + 构建可视化(安装在D盘)

个人主页:chian-ocean

前言:

随着人工智能技术的迅速发展,大语言模型在各个行业中得到了广泛应用。DeepSeek 作为一个新兴的 AI 公司,凭借其高效的 AI 模型和开源的优势,吸引了越来越多的开发者和企业关注。为了更好地满足用户的需求,尤其是在数据隐私和计算资源方面,越来越多的组织开始考虑将 DeepSeek 的 AI 模型进行 本地部署。

在这里插入图片描述

Ollama安装(安装在D盘)

官网下载:Ollama

  • 点进去官网

在这里插入图片描述

  • 系统的选择(这里面以windows为例子)

在这里插入图片描述

更改路径

  • 下载之后如果点击直接安装(install)默认会安装在C盘.

在这里插入图片描述

  • 在这里面打开终端窗口执行(这个是更改路径)
OllamaSetup.exe /DIR=D:\Ollama

解释:

  • OllamaSetup.exe: 这是一个安装程序的执行文件,通常用于安装 Ollama 软件。
  • /DIR=D:\Ollama: 这是命令行参数,告诉安装程序将 Ollama 安装到 D 盘的 Ollama 文件夹中。如果指定的目录不存在,安装程序通常会创建该文件夹。
安装程序的执行文件(OllamaSetup.exe) /DIR=path(path是一个路径)

在这里插入图片描述

  • 这里面在安装的时候我们发现正在安装在D
70990f1afbe2e9f49aecf248cc82ad1

在这里插入图片描述

更改模型安装路径

  • 在不更改默认路径下,模型安装默认也是C
  • 小默认都在5G,大模型几十G。

在这里插入图片描述

修改Windows系统环境变量

  • 进入Windows系统的环境变量。

在这里插入图片描述

  • 添加环境变量
变量名: OLLAMA_MODELS
变量值: D:\OllamaImagers(安装智能体的路径)

在这里插入图片描述

  • 将第一个文件剪切到自己想要安装的目录下

刷新环境变量

  • 重启(简单粗暴)

  • 手动刷新环境变量(无重启)

    1. 打开 任务管理器 (Ctrl + Shift + Esc)。

    2. 在任务管理器中,找到 Windows 资源管理器Explorer.exe),右键点击并选择 重新启动

    3. 这样会刷新 Windows 资源管理器的环境变量,使得新设置的环境变量生效。

模型下载和卸载

  • 按步骤操作

模型比较

模型版本参数数量文件大小适用场景优点缺点
1.5B1.5B1.1GB资源有限的环境文件较小,易于下载和部署性能较低,适用于较简单的任务
7B7B4.7GB需要较高性能的任务平衡了性能和文件大小,适用范围广泛相比小模型,仍需要较强的硬件支持
8B8B4.9GB中等性能需求的任务性能好,适合大部分NLP任务文件大小较大,部署时需要较大存储空间
14B14B9.0GB高性能应用,复杂任务适用于复杂推理和大规模任务需要较强的计算资源和存储支持
32B32B20GB大规模高负载任务高度优化,能够处理复杂任务对硬件要求极高,计算资源消耗大
70B70B43GB超高性能任务,科研应用极高的计算能力和性能,适用于尖端研究对硬件和存储要求非常苛刻,下载和运行困难
671B671B404GB超大规模高复杂度任务性能最强,适用于最复杂的应用和任务极高的硬件需求,几乎只适用于大型数据中心

本地部署 DeepSeek 模型选择简要总结

  1. 小型模型 (1.5B, 7B)
    • 适用场景:硬件资源有限、简单任务(如基础对话、文本分类)。
    • 优点:文件小、资源占用少,易于部署。
    • 缺点:性能较低,无法处理复杂任务。
  2. 中型模型 (8B, 14B)
    • 适用场景:中等性能需求,适用于中型任务(如情感分析、机器翻译)。
    • 优点:较强性能,适应广泛应用。
    • 缺点:需要中等硬件支持,文件和存储要求增加。
  3. 大型模型 (32B, 70B)
    • 适用场景:高性能需求,复杂任务(如大规模推理、科研)。
    • 优点:性能强,适合复杂应用。
    • 缺点:对硬件要求极高,需要高端 GPU 和大存储空间。
  4. 超大型模型 (671B)
    • 适用场景:超大规模、科研级任务。
    • 优点:最强性能,适合最复杂的任务。
    • 缺点:资源消耗巨大,几乎只能在大型数据中心部署。

模型下载

在这里插入图片描述

  • 复制路径
ollama run deepseek-r1:8b
  • 打开 终端(win + r)输入 cmd

复制到终端回车(Enter)

在这里插入图片描述

  • 如果下载速度慢,Ctrl + C,终止进程再次进行安装。

在这里插入图片描述

安装成功

安装成功:success

在这里插入图片描述

模型卸载

终端输入:ollama rm 模型名称

ollama rm deepseek-r1:8b

在这里插入图片描述

模型应用

查看手册

ollama  #就是查看手册

在这里插入图片描述

查看模型

ollama list #查看模型

在这里插入图片描述

运行deepseek

ollama run deepseek-r1:8b #后面是模型名称

在这里插入图片描述

构建可视化工具

下载:Chatbox AI

  • 根据自己的系统选择版本。

在这里插入图片描述

设置API接口

  • 这里面选择自己的API接口或本地模型

在这里插入图片描述

  • 这里面的API域名是正确的。

在这里插入图片描述

  • 选择模型(deepseek-r1:b8)

在这里插入图片描述

  • 构建可视化工具完成。
    在这里插入图片描述

相关文章:

从 0 开始本地部署 DeepSeek:详细步骤 + 避坑指南 + 构建可视化(安装在D盘)

个人主页:chian-ocean 前言: 随着人工智能技术的迅速发展,大语言模型在各个行业中得到了广泛应用。DeepSeek 作为一个新兴的 AI 公司,凭借其高效的 AI 模型和开源的优势,吸引了越来越多的开发者和企业关注。为了更好地…...

如何本地部署DeepSeek集成Word办公软件

目录 本地部署DeepSeek安装Ollama下载并部署DeepSeek模型安装ChatBox客户端(可选) 将DeepSeek集成到Word修改Word中的VBA代码执行操作 ✍️相关问答如何在Word中安装和使用VBA宏DeepSeek模型有哪些常见的API接口?如何优化DeepSeek在Word中的集…...

Centos10 Stream 基础配置

NetworkManger 安装 dnf install NetworkManager 查看网络配置 nmcli [rootCentos-S-10 /]# nmcli ens33:已连接 到 ens33"Intel 82545EM"ethernet (e1000), 00:0C:29:08:3E:71, 硬件, mtu 1500ip4 默认inet4 192.168.31.70/24route4 default …...

时间序列分析(三)——白噪声检验

此前篇章: 时间序列分析(一)——基础概念篇 时间序列分析(二)——平稳性检验 一、相关知识点 白噪声的定义:白噪声序列是一种在统计学和信号处理中常见的随机过程,由一系列相互独立、具有相同…...

ThinkPHP8视图赋值与渲染

【图书介绍】《ThinkPHP 8高效构建Web应用》-CSDN博客 《2025新书 ThinkPHP 8高效构建Web应用 编程与应用开发丛书 夏磊 清华大学出版社教材书籍 9787302678236 ThinkPHP 8高效构建Web应用》【摘要 书评 试读】- 京东图书 在控制器操作中,使用view函数可以传入视图…...

对贵司需求的PLC触摸的远程调试的解决方案

远程监控技术解决方案 一、需求痛点分析 全球设备运维响应滞后(平均故障处理周期>72小时)客户定制化需求频繁(每月PLC程序修改需求超50次)人力成本高企(单次跨国差旅成本约$5000)多品牌PLC兼容需求&am…...

2.12寒假作业

web:[HDCTF 2023]Welcome To HDCTF 2023 可以直接玩出来 但是这边还是看一下怎么解吧,看一下js代码,在js.game里面找到一个类似brainfuck加密的字符串 解密可以得到答案,但是后面我又去了解了一下let函数let命令、let命令 let命…...

记使用AScript自动化操作ios苹果手机

公司业务需要自动化操作手机,本来以为很困难,没想到使用AScript工具出乎意料的简单,但是还有很多坑存在,写个博客记录一下。 工具信息: 手机:iphone7 系统版本:ios15 AScript官方文档链接&a…...

【Apache Paimon】-- 16 -- 利用 paimon-flink-action 同步 kafka 数据到 hive paimon 表中

目录 引言CDC 技术概述 2.1 什么是 CDC2.2 CDC 的应用场景Kafka 作为 CDC 数据源的原理与优势 3.1 Kafka 的基本架构3.2 Kafka 在 CDC 中的角色...

基于 PyTorch 的树叶分类任务:从数据准备到模型训练与测试

基于 PyTorch 的树叶分类任务:从数据准备到模型训练与测试 1. 引言 在计算机视觉领域,图像分类是一个经典的任务。本文将详细介绍如何使用 PyTorch 实现一个树叶分类任务。我们将从数据准备开始,逐步构建模型、训练模型,并在测试…...

算法之 数论

文章目录 质数判断质数3115.质数的最大距离 质数筛选204.计数质数2761.和等于目标值的质数对 2521.数组乘积中的不同质因数数目 质数 质数的定义:除了本身和1,不能被其他小于它的数整除,最小的质数是 2 求解质数的几种方法 法1,根…...

Java 大视界 -- 人工智能驱动下 Java 大数据的技术革新与应用突破(83)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…...

【04】RUST特性

文章目录 隐藏shadowing所有权ownership堆区&栈区所有权规则变量&数据Copy Trait与Drop TraitCopy TraitDrop Trait移动克隆函数参数与返回值的所有权参数引用可变引用悬垂引用slice生命周期隐藏shadowing 有点像同名覆盖 let mut guess = String::new();let guess: u3…...

PlantUml常用语法

PlantUml常用语法,将从类图、流程图和序列图这三种最常用的图表类型开始。 类图 基础语法 在 PlantUML 中创建类图时,你可以定义类(Class)、接口(Interface)以及它们之间的关系,如继承&#…...

保存字典类型的文件用什么格式比较好

保存 Python 字典类型的数据时,有几个常见的格式可以选择,这些格式都具有良好的可读性和提取内容的便利性。以下是几种推荐的格式: JSON 格式: 优点:JSON 格式非常适合存储和传输结构化数据,具有良好的跨平…...

开源模型应用落地-Qwen1.5-MoE-A2.7B-Chat与vllm实现推理加速的正确姿势(一)

一、前言 在人工智能技术蓬勃发展的当下,大语言模型的性能与应用不断突破边界,为我们带来前所未有的体验。Qwen1.5-MoE-A2.7B-Chat 作为一款备受瞩目的大语言模型,以其独特的架构和强大的能力,在自然语言处理领域崭露头角。而 vllm 作为高效的推理库,为模型的部署与推理提…...

一竞技瓦拉几亚S4预选:YB 2-0击败GG

在2月11号进行的PGL瓦拉几亚S4西欧区预选赛上,留在欧洲训练的YB战队以2-0击败GG战队晋级下一轮。双方对阵第二局:对线期YB就打出了优势,中期依靠卡尔带队进攻不断扩大经济优势,最终轻松碾压拿下比赛胜利,以下是对决战报。 YB战队在天辉。阵容是潮汐、卡尔、沙王、隐刺、发条。G…...

deepseek+kimi一键生成PPT

1、deepseek生成大纲内容 访问deepseek官方网站:https://www.deepseek.com/ 将你想要编写的PPT内容输入到对话框,点击【蓝色】发送按钮,让deepseek生成内容大纲,并以markdown形式输出。 等待deepseek生成内容完毕后&#xff0c…...

mybatis 是否支持延迟加载?延迟加载的原理是什么?

1. MyBatis 是否支持延迟加载? 是的,MyBatis 支持延迟加载。延迟加载的主要功能是推迟数据加载的时机,直到真正需要时再去加载。这种方式能提高性能,尤其是在处理关系型数据时,可以避免不必要的数据库查询。 具体来说…...

【Android开发】安卓手机APP拍照并使用机器学习进行OCR文字识别

前言:点击手机APP上的拍照后,调取手机设备相机拍照并获取图片显示到手机APP页面,进行提取照片内的文字,并将识别结果显示在界面上,在离线模式下也可用。文末工程链接下载 演示视频: 目录 1.新建java项目 2.添加依赖 3. MainActivity.java文件 4.activity_main.xml 文…...

SciencePlots——绘制论文中的图片

文章目录 安装一、风格二、1 资源 安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格 简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源 论文绘图神器来了:一行…...

深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出:JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中,随机数的生成看似简单,却隐藏着许多玄机。无论是生成密码、加密密钥,还是创建安全令牌,随机数的质量直接关系到系统的安全性。Jav…...

基于Docker Compose部署Java微服务项目

一. 创建根项目 根项目&#xff08;父项目&#xff09;主要用于依赖管理 一些需要注意的点&#xff1a; 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件&#xff0c;否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程

本文较长&#xff0c;建议点赞收藏&#xff0c;以免遗失。更多AI大模型应用开发学习视频及资料&#xff0c;尽在聚客AI学院。 本文全面剖析RNN核心原理&#xff0c;深入讲解梯度消失/爆炸问题&#xff0c;并通过LSTM/GRU结构实现解决方案&#xff0c;提供时间序列预测和文本生成…...

处理vxe-table 表尾数据是单独一个接口,表格tableData数据更新后,需要点击两下,表尾才是正确的

修改bug思路&#xff1a; 分别把 tabledata 和 表尾相关数据 console.log() 发现 更新数据先后顺序不对 settimeout延迟查询表格接口 ——测试可行 升级↑&#xff1a;async await 等接口返回后再开始下一个接口查询 ________________________________________________________…...

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南&#xff1a;从入门到实战 一、Grunt 是什么&#xff1f; Grunt是一个基于 Node.js 的前端自动化任务运行器&#xff0c;主要用于自动化执行项目开发中重复性高的任务&#xff0c;例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

基于SpringBoot在线拍卖系统的设计和实现

摘 要 随着社会的发展&#xff0c;社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。 在线拍卖系统&#xff0c;主要的模块包括管理员&#xff1b;首页、个人中心、用户管理、商品类型管理、拍卖商品管理、历史竞拍管理、竞拍订单…...

Java数值运算常见陷阱与规避方法

整数除法中的舍入问题 问题现象 当开发者预期进行浮点除法却误用整数除法时,会出现小数部分被截断的情况。典型错误模式如下: void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

MySQL 主从同步异常处理

阅读原文&#xff1a;https://www.xiaozaoshu.top/articles/mysql-m-s-update-pk MySQL 做双主&#xff0c;遇到的这个错误&#xff1a; Could not execute Update_rows event on table ... Error_code: 1032是 MySQL 主从复制时的经典错误之一&#xff0c;通常表示&#xff…...

Leetcode33( 搜索旋转排序数组)

题目表述 整数数组 nums 按升序排列&#xff0c;数组中的值 互不相同 。 在传递给函数之前&#xff0c;nums 在预先未知的某个下标 k&#xff08;0 < k < nums.length&#xff09;上进行了 旋转&#xff0c;使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…...