当前位置: 首页 > news >正文

Windows 11 部署 GPUStack 运行 DeepSeek

1. 介绍

DeepSeek 是一个强大的深度学习框架,适用于图像识别、自然语言处理等任务。GPUStack 是一个高效的 GPU 资源管理工具,能够帮助用户更好地利用 GPU 资源进行深度学习任务。本文将详细介绍如何在 Windows 11 系统上部署 GPUStack 并运行 DeepSeek。


2. 环境准备

2.1 硬件要求

  • NVIDIA GPU(建议至少 8GB 显存)
  • 多核 CPU(建议 Intel i5 或更高)

2.2 环境介绍

  • Windows 11 操作系统
  • CUDA Toolkit(建议版本 11.7 或更高)
    CUDA 包含显卡驱动程序
  • GPUStack 安装

3. 安装与配置

3.1 CUDA 安装

CUDA 12.8 下载地址

CUDA
安装很简单,一路下一步。

3.2 GPUStack 安装

  1. 下载 GPUStack 安装包
Invoke-Expression (Invoke-WebRequest -Uri "https://get.gpustack.ai" -UseBasicParsing).Content

PowerShell 安装 GPUStack
安装过程中,回下载相关程序和插件。

GPUStack 使用80,10150,10151端口监听。
在这里插入图片描述

3.3 GPUStack 运行

http://localhost 访问 Dashboard。
在这里插入图片描述

3.4 安装 Deepseek

模型库
在这里插入图片描述
选择 Deepseek R1 模型
在这里插入图片描述
保存后,模型下载初始化,开始下载。
在这里插入图片描述
下载完成校验成功自动运行。
开始使用:
在这里插入图片描述

4. 模型对比总结

问题:请帮忙写一个 Sql Server 批量删除指定列表表的脚本

  • R1 1.5B
    • 速度很快,每秒3-4个TOKEN
    • 输出结果真是没脸见,准确度差
  • R1 14B
    • 速度非常慢,每秒1-2个TOKEN
    • 结果的准确度提高,和想要的偏差不大
    • 体验毫无
      在这里插入图片描述
      在这里插入图片描述

5. 重启

电脑重启后,直接打开 PowerShell 运行 GPUStack Start 即可。
在这里插入图片描述

6. 14B 资源使用前后

使用DS 14B,资源跑满。
在这里插入图片描述
结束DS后。
在这里插入图片描述
6. 结论
在 Windows 11 系统上成功部署 GPUStack 并运行 DeepSeek。GPUStack 能够有效管理 GPU 资源,而 DeepSeek 则为深度学习任务提供了强大的支持。在这个时代,工作和生活真的是多姿多彩!

愿所有人,都能享受时代进步带来的便利。

**喜欢的话,请收藏 | 关注(✪ω✪)**
……**万一有趣的事还在后头呢,Fight!!(o^-^)~''☆ミ☆ミ**……

相关文章:

Windows 11 部署 GPUStack 运行 DeepSeek

1. 介绍 DeepSeek 是一个强大的深度学习框架,适用于图像识别、自然语言处理等任务。GPUStack 是一个高效的 GPU 资源管理工具,能够帮助用户更好地利用 GPU 资源进行深度学习任务。本文将详细介绍如何在 Windows 11 系统上部署 GPUStack 并运行 DeepSeek…...

LangChain教程 - RAG - PDF问答

系列文章索引 LangChain教程 - 系列文章 在现代自然语言处理(NLP)中,基于文档内容的问答系统变得愈发重要,尤其是当我们需要从大量文档中提取信息时。通过结合文档检索和生成模型(如RAG,Retrieval-Augment…...

Windows 图形显示驱动开发-WDDM 3.2-自动显示切换(十二)

API 更改 ADS 功能增加了以下公共 API 功能: 枚举系统中的多路复用器设备。查询有关多路复用器的信息,例如,它连接了哪些目标,以及当前切换到哪个目标。触发多路复用器切换。如何检测多路复用器是否已切换。 枚举系统中的多路复…...

《当齐天大圣踏入3A游戏世界:黑神话·悟空的破壁传奇》:此文为AI自动生成

国产 3A 游戏的破晓之光 2024 年 8 月 20 日,这一天注定被铭记在中国游戏发展的史册上。国产首款 3A 游戏《黑神话・悟空》震撼上线,犹如一颗重磅炸弹,在全球游戏市场掀起了惊涛骇浪。仅仅上线 3 小时,其同时在线人数便突破了 140 万,一举打破 Steam 纯单机游戏最高在线纪…...

Graphics View画一个可调速的风机(pyqt)

效果如图: 风机具备调节转速的功能,转速通过扇叶旋转的快慢来区别,共分为四档,其中零档为静止状态,而一、二、三档则依次增加转速。在代码中,BlowerWrapper 类包含了可旋转的扇叶、风机外框以及选项三个主要…...

基于django图书信息管理系统的搭建(增删改查)

✍django项目搭建教程 ☞ ----------------- 教程 本文主要讲解django如何连接数据库MySQL并且可视化展示,实现增删改查功能 目录 一. 创建django应用 二. 数据库配置 三. 查看数据库 四. 编写代码 4.1视图函数 4.2 配置URL 4.3创建模板文件 4.…...

Python 编程题 第四节:斐波那契数列、列表的复制、暂停后输出、成绩评级、统计字符

斐波那契数列 方法一(递归) def f(a):if a1:return 1elif a2:return 1else:return f(a-1)f(a-2) print(f(3)) 方法二(非递归) nint(input()) lst[1,1] for i in range(2,n1):lst.append(lst[i-1]lst[i-2]) print(lst[n-1]) 列…...

【华为OD机考】华为OD笔试真题解析(15)--异常的打卡记录

题目描述 考勤记录是分析和考核职工工作时间利用情况的原始依据,也是计算职工工资的原始依据,为了正确地计算职工工资和监督工资基金使用情况,公司决定对员工的手机打卡记录进行异常排查。 如果出现以下两种情况,则认为打卡异常…...

跟我学C++中级篇——定时器的设计

一、定时器 谈到定时器,理论上讲是各种语言和各种设计都无法避开的一个技术点。对于定时器来说,表面上就是一种时间间隔的处理约定,但对程序来说,可能就是设计层面、接口层面和库或框架以及系统应用的一个大集合。不同的系统&…...

HTTP 请求时传递多部分表单数据

HTTP 请求时传递多部分表单数据(multipart/form-data) --data-raw $------demo11111\r\nContent-Disposition: form-data; name"Filedata"; filename"截屏2025-02-27 15.45.46.png"\r\nContent-Type: image/png\r\n\r\n\r\n------d…...

第J3-1周:DenseNet算法 实现乳腺癌识别

文章目录 一、前言二、前期准备1.设置GPU2.划分数据集 三、搭建网络模型1.DenseLayer模块2.DenseBlock模块3.Transition模块4.构建DenseNet5.构建densenet121 四、训练模型1.编写训练函数2.编写测试函数3.正式训练 五、结果可视化1.Loss与Accuracy图2.模型评估 总结&#xff1a…...

Mac 版 本地部署deepseek ➕ RAGflow 知识库搭建流程分享(附问题解决方法)

安装: 1、首先按照此视频的流程一步一步进行安装:(macos版)ragflowdeepseek 私域知识库搭建流程分享_哔哩哔哩_bilibili 2、RAGflow 官网文档指南:https://ragflow.io 3、RAGflow 下载地址:https://github.com/infi…...

【解决】OnTriggerEnter/OnTriggerExit 调用匿名委托误区的问题

开发平台:Unity 开发语言:CSharp 6.0 开发工具:Visual Studio 2022   问题背景 public void OnTriggerEnter(Collider collider) {output.OnInteractionNoticed () > OnInteractionTriggered?.Invoke(); }public void OnTriggerExit(C…...

vscode集成DeepSeek

vscode 扩展 安装 Cline Meet Cline,一个可以使用你的CLI和编辑器的AI助手。 得益于 Claude 3.5 Sonnet的代理编码功能,Cline 可以逐步处理复杂的软件开发任务。借助让他创建和编辑文件、探索大型项目、使用浏览器和执行终端命令(在您授予权限后)的工具&…...

MapReduce编程模型

MapReduce编程模型 理解MapReduce编程模型独立完成一个MapReduce程序并运行成功了解MapReduce工程流程掌握并描述出shuffle全过程(面试)独立编写课堂及作业中的MR程序理解并解决数据倾斜 1. MapReduce编程模型 Hadoop架构图 Hadoop由HDFS分布式存储、M…...

SQL server2022的详细安装流程以及简单使用

鉴于SQL Server2008R2版本过于老旧,本文主要讲述如何安装SQL Server 2022。 本文主要详细介绍SQL server2022的详细安装流程以及简单使用,以《数据库系统概论(第5版)》的第79页—第80页为例,详细介绍如何使用SQL serv…...

Linux的诞生:一场自由与协作的技术革命

Linux的诞生:一场自由与协作的技术革命 在今天的互联网世界,Linux几乎无处不在——从智能手机(Android内核)到超级计算机,从云计算平台到家用路由器,它的身影渗透在技术的各个角落。但这样一个改变世界的操…...

Pytorch为什么 nn.CrossEntropyLoss = LogSoftmax + nn.NLLLoss?

为什么 nn.CrossEntropyLoss LogSoftmax nn.NLLLoss? 在使用 PyTorch 时,我们经常听说 nn.CrossEntropyLoss 是 LogSoftmax 和 nn.NLLLoss 的组合。这句话听起来简单,但背后到底是怎么回事?为什么这两个分开的功能加起来就等于…...

Go入门之文件

以只读方式打开文件 package mainimport ("fmt""io""os" )func main() {file, err : os.Open("./main.go")defer file.Close()if err ! nil {fmt.Println(err)return}fmt.Println(file)var tempSlice make([]byte, 128)var strSlice…...

基因型—环境两向表数据分析——品种生态区划分

参考资料:农作物品种试验数据管理与分析 用于品种生态区划分的GGE双标图有两种功能图:试点向量功能图和“谁赢在哪里”功能图。双标图的具体模型基于SD定标和h加权和试点中心化的数据。本例中籽粒产量的GGE双标图仅解释了G和GE总变异的53.6%,…...

Dify开发AI智能体的费用

Dify 的计费逻辑与 Coze 有显著不同,它最大的特点是“开源免费”与“云端订阅”并存。由于它不强制绑定大模型,你的总支出通常由“平台费 模型流量费”两部分组成。以下是截至 2026 年 4 月的详细费用拆解:1. 部署模式决定基础费用开源社区版…...

Exegol未来展望:AI驱动的安全测试与云原生架构的发展趋势

Exegol未来展望:AI驱动的安全测试与云原生架构的发展趋势 【免费下载链接】Exegol Fully featured and community-driven hacking environment 项目地址: https://gitcode.com/gh_mirrors/ex/Exegol Exegol作为一个功能全面且社区驱动的网络安全测试环境&…...

手机摄影党必看!用Flare7K数据集原理改善夜间拍摄(华为/iPhone实测)

手机摄影党必看!用Flare7K数据集原理改善夜间拍摄(华为/iPhone实测) 夜间拍摄时,你是否经常遇到这样的困扰:路灯变成模糊的光团,霓虹灯周围出现奇怪的彩虹条纹,或是画面中突然多出几条不明来源的…...

ADS(Advanced Design System)高效集成供应商库(Vendor Libraries)的实战指南

1. 为什么需要供应商库? 刚接触ADS的射频工程师常会遇到这样的困境:设计一个简单的滤波器,光是找合适的电容电感模型就要花半天时间。Murata的0402封装电容该用哪个SPICE模型?AVX的叠层电感参数怎么设置?这时候**供应商…...

仅限TOP20量化机构内部流通的C++内存池测试矩阵(含FPGA协处理器适配层验证项),现在限时解密!

第一章:金融级C内存池测试的范式演进与行业背景在高频交易、实时风控与低延迟结算等金融核心系统中,内存分配性能直接决定毫秒级响应能力的上限。传统 malloc/free 在高并发小对象场景下易引发锁争用、碎片化加剧与缓存行失效,迫使头部券商与…...

含分布式电源的IEEE33节点配电网的潮流计算程序,程序考虑了风光接入下的潮流计算问题将风光等...

含分布式电源的IEEE33节点配电网的潮流计算程序,程序考虑了风光接入下的潮流计算问题将风光等效为PQV PI等节点处理,采用牛拉法开展潮流计算,而且程序都有注释 –以下内容属于A解读,有可能是一本正经的胡说八道,仅供参…...

告别虚拟机!在Win10上为ARM开发板(如TI AM62x)搭建Qt Widgets开发环境全记录

告别虚拟机!在Win10上为ARM开发板搭建Qt Widgets开发环境全记录 嵌入式开发工程师们对这样的场景一定不陌生:为了给ARM平台开发Qt应用,不得不启动笨重的Linux虚拟机,在两种操作系统间频繁切换。这不仅消耗系统资源,更…...

DA14531 实战指南(一)从调试到量产:OTP与Flash的权衡艺术

1. 初识DA14531的存储双刃剑 第一次拿到DA14531开发板时,最让我纠结的就是这个32KB的OTP存储器。就像给你一支只能写一次的钢笔,虽然墨水充足(32KB对BLE应用绰绰有余),但每次落笔都要反复斟酌。实际开发中我发现&#…...

Phi-4-mini-reasoning效果展示:中英文混合数学题的跨语言推理能力

Phi-4-mini-reasoning效果展示:中英文混合数学题的跨语言推理能力 1. 模型核心能力概览 Phi-4-mini-reasoning是一款专注于推理任务的文本生成模型,特别擅长处理数学题、逻辑题等需要多步分析的场景。与通用聊天模型不同,它更专注于"问…...

oicq 高级技巧:如何构建企业级 QQ 机器人应用架构

oicq 高级技巧:如何构建企业级 QQ 机器人应用架构 【免费下载链接】oicq Tencent QQ Bot Library for Node.js 项目地址: https://gitcode.com/gh_mirrors/oi/oicq oicq 是一个基于 Node.js 的 QQ 协议库,专为构建稳定、高效的 QQ 机器人应用而设…...