DeepSeek 概述与本地化部署【详细流程】

目录
一、引言
1.1 背景介绍
1.2 本地化部署的优势
二、deepseek概述
2.1 功能特点
2.2 核心优势
三、本地部署流程
3.1 版本选择
3.2 部署过程
3.2.1 下载Ollama
3.2.2 安装Ollama
3.2.3 选择 r1 模型
3.2.4 选择版本
3.2.5 本地运行deepseek模型
3.3.6 查看已有模型
3.3 使用客户端工具
4. 总结
一、引言
1.1 背景介绍
DeepSeek,中文名为“深度求索”,是一家位于杭州的人工智能公司,由知名对冲基金 High-Flyer 投资支持。该公司专注于人工智能基础技术研究,并以其开源的大型语言模型在业内脱颖而出。通过将这些模型开源,深度求索不仅推动了技术的发展,还让更多开发者能够参与到人工智能的进步中来,这种开放的态度赢得了广泛的关注和认可。
1.2 本地化部署的优势
通过本地部署,可以完全掌控数据的存储和传输过程,减少了因第三方平台安全漏洞导致的数据泄露风险。避免了将敏感信息上传到云端的风险。这对于涉及个人隐私或商业机密的数据尤为重要。
二、deepseek概述
DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的AI大模型,具备强大的智能问答和多模态交互能力。它能够理解并生成自然语言,提供精准的回答和建议,适用于多个领域,如教育、科技、生活等。DeepSeek的核心优势在于其低成本、高效率的训练和推理能力,打破了传统N卡垄断,降低了大模型的使用门槛。
2.1 功能特点
(1) 深层次逻辑推理
DeepSeek 不仅能够处理简单的问题,还能在面对复杂问题时进行深入的逻辑分析。无论是多步骤的推理还是复杂的决策支持,DeepSeek 都能提供有力的帮助,帮助用户找到最佳解决方案。
(2) 文档解析与总结
无论您需要处理的是 PDF、Word 文档,还是其他格式的文件,DeepSeek 都能轻松应对。只需将文件上传给 DeepSeek,它就能快速分析内容,提取关键要点,并生成简洁明了的总结报告。这一功能特别适合需要高效处理大量文档的专业人士,如研究人员、律师或记者,显著提升工作效率。
(3) 实时信息获取
通过其强大的联网搜索功能,DeepSeek 能够实时抓取最新的信息和数据。这对于那些需要时刻了解最新动态的用户来说尤为重要,比如新闻工作者、市场分析师或任何需要及时获取最新资讯的人士。您可以依赖 DeepSeek 获取最前沿的信息,保持竞争力。当然这一点得结合实际,可能最新消息更新得时间点有所延后。
(4) 全方位应用场景
无论是对话聊天、语言翻译、创意写作、编程辅助、解题答疑、文献解读,还是旅行规划,DeepSeek 都能派上用场。简直是居家旅行必备良品!
2.2 核心优势
(1) 智能化
DeepSeek能够理解复杂的问题,并提供精准的解决方案。它通过深度学习和自然语言处理技术,能够理解用户的需求并提供个性化的建议。
(2) 多功能性
DeepSeek在多个领域都有广泛的应用,包括学习、工作和生活。它可以用作学习助手、编程助手、写作助手、生活助手和翻译助手等,满足用户在不同场景下的需求。
(3) 易用性
DeepSeek通过自然语言交互,用户无需学习复杂的操作即可与模型进行对话。这种交互方式使得用户能够轻松地获取所需的信息和服务。
(4) 低成本
DeepSeek的训练和推理成本较低,打破了传统N卡垄断,降低了大模型的使用门槛。这使得更多的企业和个人能够使用高性能的AI服务。
(5) 高效率
DeepSeek在推理能力和响应速度上表现出色,能够快速处理复杂的查询和任务,提供准确的答案和解决方案。
(6) 开源生态
DeepSeek采用了开源策略,吸引了大量开发者和研究人员的参与,推动了AI技术的发展和应用。
(7) 本地部署优势
DeepSeek支持本地部署,确保数据隐私和安全,同时提供更高的性能和稳定性,适合对数据安全要求较高的企业和机构。
三、本地部署流程
3.1 版本选择
本地部署就是自己部署DeepSeek-R1模型,使用本地的算力,
主要瓶颈:内存+显存的大小。
特点:此方案不用联网。
适合:有数据隐私方面担忧的或者保密单位根本就不能上网的。
使用满血版:DeepSeek R1 671B 全量模型的文件体积高达 720GB,对于绝大部分人而言,本地资源有限,很难达到这个配置
蒸馏版本:


蒸馏版本链接:https://huggingface.co/deepseek-ai
开源2+6个模型。R1预览版和正式版的参数高达660B,非一般公司能用。为进一步平权, 于是他们就蒸馏出了6个小模型,并开源给社区。最小的为1.5B参数,10G显存可跑。
如果你要在个人电脑上部署,一般选择其他架构的蒸馏模型,本质是微调后的Llama或Qwen模型,基本32B以下,并不能完全发挥出DeepSeek R1的实力。
3.2 部署过程
3.2.1 下载Ollama
Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。 Ollama 提供了一个简单的方式来加载和使用各种预训练的语言模型,支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。 Ollama 的特点在于它不仅仅提供了现成的模型和工具集,还提供了方便的界面和 API,使得从文本生成、对话系统到语义分析等任务都能快速实现。
访问链接: Ollama

根据自己的操作系统选择 ↓ ↓ ↓

3.2.2 安装Ollama
就傻瓜式安装

安装完成后,检验是否安装成功。
`win+r` 输入 cmd

命令行输入
ollama -v
能显示版本,就说明安装成功。

3.2.3 选择 r1 模型

3.2.4 选择版本

b代表10亿参数量,7b就是70亿参数量。这里的671B是 HuggingFace经过4-bit 标准量化的,所以大小是404GB
ollama 支持 CPU 与 GPU 混合推理。将内存与显存之和大致视为 系统的 “总内存空间”。 如果你想运行404GB的671B,建议你的内存+显存能达到500GB以 上
除了模型参数占用的内存+显存空间(比如671B的404GB)以 外,实际运行时还需额外预留一些内存(显存)空间用于上 下文缓存。预留的空间越大,支持的上下文窗口也越大。所 以根据你个人电脑的配置,评估你选择部署哪一个版本。如 果你想运行404GB的671B,建议你的内存+显存能达到500GB 以上
这里我们以7B为例,大多数的电脑都能够运行起来。

3.2.5 本地运行deepseek模型
再命令中,输入如下命令
ollama run deepseek-r1:7b

注意:
下载支持断点续传,如果下载中速度变慢,可以鼠标点击命 令行窗口,然后ctrl+c取消,取消后按方向键“上”,可以找到 上一条命令,即”ollama run deepseek-r1:7b“,按下回车会重新链接,按照之前进度接着下载。
下载完成后,自动进入模型,直接在命令行输入问题,即可得到回复。

获取帮助
/?
退出对话
/bye
3.3.6 查看已有模型
代码如下
ollama list

后续要运行模型,仍然使用之前的命令
ollama run deepseek-r1:7b
3.3 使用客户端工具
本地部署好模型之后,在命令行操作还是不太方便,我们继 续使用一些客户端工具来使用。
我们使用 Cherry Studio,Cherry Studio 是一个支持多模型服务的桌面客户端,为专业用户而打造,内置 30 多个行业的智能助手,帮助用户在多种场景下提升工作效率。
Cherry Studio的下载地址:https://cherry-ai.com/

就直接傻瓜式安装。
然后我们以Cherry Studio为例访问7b的蒸馏模型。

如何这里没有显示r1模型,那么说明你之前没有安装好,去重新安装。

然后去选择模型,值得注意的是,使用时要确保ollama客户端已启动。
然后提问 ↓ ↓ ↓

4. 总结
以上就是deepseek本地化部署的全部内容,部署流程参考B站尚硅谷 👇 👇 👇30-部署方式3:本地算力部署_哔哩哔哩_bilibili
更多内容点击下面链接查看 👇 👇 👇
专栏管理-CSDN创作中心
相关文章:
DeepSeek 概述与本地化部署【详细流程】
目录 一、引言 1.1 背景介绍 1.2 本地化部署的优势 二、deepseek概述 2.1 功能特点 2.2 核心优势 三、本地部署流程 3.1 版本选择 3.2 部署过程 3.2.1 下载Ollama 3.2.2 安装Ollama 3.2.3 选择 r1 模型 3.2.4 选择版本 3.2.5 本地运行deepseek模型 3.3.6 查看…...
FFmpeg Video options
FFmpeg视频相关选项 1. -vframes number (output) 设置输出视频帧数 示例: ffmpeg -i input.mp4 -vframes 90 output.mp4 表示输出90帧视频 2. -r[:stream_specifier] fps (input/output,per-stream) 设置帧率(rate) 示例: ffmpeg -i input.mp4…...
从51到STM32:PWM平滑迁移方案
引言 对于习惯使用51单片机的开发者而言,转向STM32时可能会面临开发环境和硬件差异的挑战。本文以PWM(脉宽调制)功能为例,分享从51到STM32的平滑迁移方案,帮助开发者快速适应STM32的开发模式。 一、PWM实现原理对比 …...
openCV中如何实现滤波
图像滤波用于去除噪声和图像平滑,OpenCV 提供了多种滤波器: 1.1. 均值滤波: import cv2# 读取图像 image cv2.imread("example.jpg")# 均值滤波 blurred_image cv2.blur(image, (5, 5)) # (5, 5) 是滤波核的大小 滤波核大小的…...
BGP配置华为——路由汇总
实验拓扑 实验要求 1.R1,R2,R3间运行BGP,搭建EBGP邻居 2.R3一段的网络实现自动聚合,R1一端的网络实现手动路由聚合 3.启用as-set防环 实验配置 配置相关IP 过程省略,结果如图 R1 R2 R3 配置EBGP [R1]bgp 100 [R1-bgp]router 10.10.1…...
机器学习核心算法解析
机器学习核心算法解析 机器学习是人工智能的核心技术之一,它通过从数据中学习模式并做出预测或决策。本文将深入解析机器学习的核心算法,包括监督学习、无监督学习和强化学习,并通过具体案例和代码示例帮助读者理解这些算法的实际应用。 1. …...
【C++学习篇】C++11
目录 编辑 1. 初始化列表{} 1.1 C98中的{} 1.2 C11中的{} 2. C11中的std::initializer_list 3. 右值引用和移动语义 3.1 左值和右值 3.2 左值引用和右值引用 3.3 引用延长生命周期 3.4 左值和右值的参数匹配 3.5 右值引⽤和移动语义的使⽤场景 3.5.1 左值引⽤…...
SQLite 数据库:优点、语法与快速入门指南
文章目录 一、引言二、SQLite 的优点 💯三、SQLite 的基本语法3.1 创建数据库3.2 创建表3.3 插入数据3.4 查询数据3.5 更新数据3.6 删除数据3.7 删除表 四、快速入门指南4.1 安装 SQLite4.2 创建数据库4.3 创建表4.4 插入数据4.5 查询数据4.6 更新数据4.7 删除数据4…...
数据结构——二叉树(2025.2.12)
目录 一、树 1.定义 (1)树的构成 (2)度 2.二叉树 (1)定义 (2)二叉树的遍历 (3)遍历特性 二、练习 1.二叉树 (1)创建二叉树…...
图神经网络简介
一、说明 本文介绍了GNN网络一些要素,其中与CNN进行过一些对比,并且对GNN的一些统计原理进行介绍。 二、介绍 对于不同类型的训练数据集,卷积神经网络 (CNN) 擅长处理方形或网格状或欧几里得结构化数据,…...
小程序报错The JavaScript function Pointer_stringify(ptrToSomeCString)
小程序报错The JavaScript function Pointer _stringify(ptrToSomeCString) 介绍修改地址总结 介绍 这个报错是我在打包小程序在手机上运行时报的错,这个地方问题是个小问题,其实就是Pointer_stringify(ptrToSomeCString) 函数过时…...
DeepSeek 与网络安全:AI 驱动的智能防御
📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言 随着人工智能(AI)的快速发展,深度学习技术正渗透到多个领域,从医疗诊断到…...
Redission看门狗
在 Redisson 中,lock.tryLock() 和 lock.lock() 是两种不同的加锁方式,它们的行为有所不同: lock.lock():这是阻塞方法,当调用时,如果锁当前不可用,线程将被阻塞,直到获取到锁。如果…...
LeetCode 热题 100_组合总和(58_39_中等_C++)(递归(回溯))
LeetCode 热题 100_组合总和(58_39) 题目描述:输入输出样例:题解:解题思路:思路一(递归(回溯)): 代码实现代码实现(思路一(…...
使用PHP爬虫获取1688商品分类:实战案例指南
在电商领域,商品分类信息是商家进行市场调研、选品分析和竞争情报收集的重要基础。1688作为国内领先的B2B电商平台,提供了丰富且详细的商品分类数据。通过PHP爬虫技术,我们可以高效地获取这些分类信息,为商业决策提供有力支持。 …...
Nginx location 和 proxy_pass 配置详解
概述 Nginx 配置中 location 和 proxy_pass 指令的不同组合方式及其对请求转发路径的影响。 配置效果 1. location 和 proxy_pass 都带斜杠 / location /api/ {proxy_pass http://127.0.0.1:8080/; }访问地址:www.hw.com/api/upload转发地址:http://…...
云创智城充电系统:基于 SpringCloud 的高可用、可扩展架构详解-多租户、多协议兼容、分账与互联互通功能实现
在新能源汽车越来越普及的今天,充电基础设施的管理和运营变得越来越重要。云创智城充电系统,就像一个超级智能管家,为新能源充电带来了全新的解决方案,让充电这件事变得更方便、更高效、更安全。 一、厉害的技术架构,让…...
AIP-143 标准代号
编号143原文链接AIP-143: Standardized codes状态批准创建日期2019-07-24更新日期2019-07-24 许多常见的概念,如语言、国家、货币等,都有用于数据通信和处理的通用代号(通常由国际标准化组织正式定义)。这些代号解决了在书面语言…...
机器视觉--数字图像格式
图像格式 在数字图像的世界里,不同的图像格式有着各自的特点和适用场景。了解这些图像格式,对于我们在处理图像时选择合适的存储和传输方式至关重要。下面就让我们来详细探讨一下常见的几种数字图像格式。 一、BMP 文件(Bitmap)…...
Kotlin 2.1.0 入门教程(十七)接口
接口 接口可以包含抽象方法的声明,也可以包含方法的实现。 接口与抽象类的不同之处在于,接口无法存储状态。接口可以拥有属性,但这些属性要么必须是抽象的,要么就得提供访问器的实现。 接口使用 interface 关键字来定义&#x…...
CANN驱动带外通道状态查询
dcmi_get_device_outband_channel_state 【免费下载链接】driver 本项目是CANN提供的驱动模块,实现基础驱动和资源管理及调度等功能,使能昇腾芯片。 项目地址: https://gitcode.com/cann/driver 函数原型 int dcmi_get_device_outband_channel_s…...
Hermes Agent对接Taotoken自定义提供商配置详解
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Hermes Agent对接Taotoken自定义提供商配置详解 1. 准备工作 在开始配置之前,你需要准备好两样东西:一个有…...
基于区块链与DAO的性勒索防治:分布式安全网络架构与技术实现
1. 项目概述:当技术成为守护者“性勒索”这个词,听起来就让人不寒而栗。它利用受害者的私密信息,如照片、视频或聊天记录,进行敲诈勒索,其核心是制造恐惧、羞耻和孤立感。传统的应对方式,无论是报警、寻求心…...
ChatGPT在教育领域的应用、挑战与未来展望:AI导师如何重塑教学
1. 项目概述:当AI导师走进课堂“ChatGPT在教育领域的应用、挑战与未来展望”这个标题,乍一看像是一篇学术论文的题目,但背后折射出的,是每一位教育工作者、学生乃至家长都在亲身经历的一场静默革命。作为一名长期关注技术与教育交…...
树莓派4B上Kali Linux安装RTL8812AU驱动的完整指南(含国内源优化)
树莓派4B上Kali Linux安装RTL8812AU驱动的完整指南(含国内源优化) 在网络安全测试和渗透评估领域,Kali Linux凭借其丰富的工具集成为从业者的首选系统。而树莓派4B以其便携性和低功耗特性,成为移动安全测试的理想硬件平台。本文将…...
CANN/pyasc取小数计算函数
asc.language.adv.frac 【免费下载链接】pyasc 本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。 项目地址: https://gitcode.com/cann/pyasc asc.language.adv.frac(dst: LocalT…...
AI高通量实验平台:数据驱动电池级碳酸锂工艺优化
1. 项目概述:当AI遇见“白色石油”的提纯革命电池级碳酸锂,这个被誉为“白色石油”的关键材料,其生产工艺的每一次微小优化,都牵动着整个新能源产业链的神经。传统的工艺优化,往往依赖于工程师的经验和“试错法”&…...
CANN元数据定义FrameworkType
FrameworkType 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 函数功能 设置原始模型的框架类型。 函数原型 [OpRegistrationData](https://link.gitcode.com/i/e39588e20f92bc787b393b3e218d186f) &Framewor…...
泰山派3M-RK3576-镜像烧录-成品镜像烧录
【立创泰山派3-RK3576开发板】成品镜像烧录 什么是成品镜像 简单来说就是一个 .img 就是完整的系统镜像,烧录这一个就可以完整的运行系统,这样的镜像叫做成品镜像。 这样的镜像体积都比较大,但胜在烧录方便。 例如:update.img…...
Arm Neoverse V3AE性能监控架构与PMU寄存器详解
1. Arm Neoverse V3AE性能监控架构深度解析在处理器微架构设计中,性能监控单元(PMU)如同汽车的仪表盘,为开发人员提供观察硬件行为的直接窗口。Arm Neoverse V3AE作为面向基础设施的高性能核心,其PMU实现包含一组精密的…...
