当前位置: 首页 > article >正文

Windows环境下使用Ollama搭建本地AI大模型教程

注:Ollama仅支持Windows10及以上版本。

安装Ollama

去 ollama官网 下载对应平台及OS的安装包。

运行安装包,点击“安装”按钮即可开始安装。Ollama会自动安装到你的 C:\Users\<当前用户名>\AppData\Local\Programs\Ollama 目录上。

运行Ollama安装包
安装完成后,Ollama会自动启动。启动时任务栏中图标显示如下:

开始菜单中的Ollama快捷方式

当Ollama未启动时,可以通过点击开始菜单Ollama快捷方式或者直接定位安装目录的方式手动启动程序。

安装目录中直接点击程序启动

(可选)自定义的模型存储目录

在拉取数据模型之前,我们必须意识到,Ollama默认模型存储的目录是 C:\Users\<当前用户名>\.ollama\models 。这也意味着,如果你的C盘空间不够大的话,在拉取大维度数据模型的时候会因空间不足而失败——数据模型维度越高,占用磁盘空间越大。

为了避免这种尴尬的问题,我们的第一思路是将默认模型存储的目录移动到其它磁盘上。具体来说,我们可以通过设置环境变量来确定这一点。

还是老一套:右键“计算机”–>“属性”–>“高级系统设置”–>“环境变量”,打开环境变量界面。

打开环境变量界面

新增一个名为OLLAMA_MODELS环境变量,变量值则设置为你想要存储模型的目录路径。例如:D:\OllamaModels。

设置环境变量
设置完成后,点击“确定”保存更改。

拉取数据模型

首先我们要确定一个问题:我们要使用什么样的数据模型?

去 ollama官网 上查看所有Ollama支持的数据模型。

Ollama数据模型搜索页面

模型的种类不同,侧重方向也不一样。而同一模型当中,数据维度(参数量)越大,训练速度越快,但需要的磁盘空间和运行时内存也越多。因此,我们还需要根据自己的硬件条件来选择合适的模型。下面以deepseek-r1模型为例:

deepseek-r1

数据维度初始磁盘空间运行时最低内存
1.5b1.1GB2GB
7b(默认)4.7GB6GB
8b4.9GB6.5GB
14b9GB12GB
32b20GB24GB
70b43GB66GB
671b404GB550GB

注意:运行时最低内存为估算值。

当你选取了适当的模型之后,我们就可以拉取它了。

  1. 打开cmd命令行,运行以下命令:

cd C:\Users\<当前用户名>\AppData\Local\Programs\Ollama

此时命令行移动到了Ollama的安装目录。

  1. 此时再运行以下命令:

./ollama.exe pull <所选的数据维度模型>:<所选的数据维度>

例如,如果我们选取了deepseek-r1的1.5b版本,则运行

./ollama.exe pull deepseek-r1:1.5b

静待数据模型拉取完成,搭建工作圆满结束。

(可选)(仅Nvidia显卡可用)使用CUDA工具包,把显存用起来

在进行此项 可选的 工作之前,你应该确保:

  1. Nvidia显卡驱动正常运行。
  2. 已安装最新的Nvidia app应用程序。

打开命令行,运行命令:

nvidia-smi.exe

此时会显示如下信息:

CUDA版本号

图中红框中的即为CUDA版本号,安装CUDA工具包的版本号不得高于该版本号

去 Nvidia官网 上下载合适版本的CUDA工具包。

点击安装包,按照提示完成安装。

在确保模型被运行的情况下,打开命令行,运行“nvidia-smi.exe”命令。结果如下:

运行Ollama时,显存已被使用了一部分,CUDA工具包已经成功安装

红框显示,此时发现显存已被使用了一部分,CUDA工具包已经成功安装了。

相关文章:

Windows环境下使用Ollama搭建本地AI大模型教程

注&#xff1a;Ollama仅支持Windows10及以上版本。 安装Ollama 去 ollama官网 下载对应平台及OS的安装包。 运行安装包&#xff0c;点击“安装”按钮即可开始安装。Ollama会自动安装到你的 C:\Users\<当前用户名>\AppData\Local\Programs\Ollama 目录上。 安装完成后&…...

2024年认证杯SPSSPRO杯数学建模A题(第二阶段)保暖纤维的保暖能力全过程文档及程序

2024年认证杯SPSSPRO杯数学建模 A题 保暖纤维的保暖能力 原题再现&#xff1a; 冬装最重要的作用是保暖&#xff0c;也就是阻挡温暖的人体与寒冷环境之间的热量传递。人们在不同款式的棉衣中会填充保暖材料&#xff0c;从古已有之的棉花、羽绒到近年来各种各样的人造纤维。不…...

算法19(力扣244)反转字符串

1、问题 编写一个函数&#xff0c;其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。 不要给另外的数组分配额外的空间&#xff0c;你必须原地修改输入数组、使用 O(1) 的额外空间解决这一问题。 2、示例 &#xff08;1&#xff09; 示例 1&a…...

DeepSeek 助力 Vue 开发:打造丝滑的卡片(Card)

前言&#xff1a;哈喽&#xff0c;大家好&#xff0c;今天给大家分享一篇文章&#xff01;并提供具体代码帮助大家深入理解&#xff0c;彻底掌握&#xff01;创作不易&#xff0c;如果能帮助到大家或者给大家一些灵感和启发&#xff0c;欢迎收藏关注哦 &#x1f495; 目录 Deep…...

ESP32 arduino + DeepSeek API访问

此项目主要使用ESP32-S3实现一个AI语音聊天助手&#xff0c;可以通过该项目熟悉ESP32-S3 arduino的开发&#xff0c;百度语音识别&#xff0c;语音合成API调用&#xff0c;百度文心一言大模型API的调用方法&#xff0c;音频的录制及播放&#xff0c;SD卡的读写&#xff0c;Wifi…...

最新国内 ChatGPT Plus/Pro 获取教程

最后更新版本&#xff1a;20250202 教程介绍&#xff1a; 本文将详细介绍如何快速获取一张虚拟信用卡&#xff0c;并通过该卡来获取ChatGPT Plus和ChatGPT Pro。 # 教程全程约15分钟开通ChatGPT Plus会员帐号前准备工作 一个尚未升级的ChatGPT帐号&#xff01;一张虚拟信用卡…...

SQLMesh 系列教程4- 详解模型特点及模型类型

SQLMesh 作为一款强大的数据建模工具&#xff0c;以其灵活的模型设计和高效的增量处理能力脱颖而出。本文将详细介绍 SQLMesh 模型的特点和类型&#xff0c;帮助读者快速了解其强大功能。我们将深入探讨不同模型类型&#xff08;如增量模型、全量模型、SCD Type 2 等&#xff0…...

三维重建(十二)——3D先验的使用

文章目录 零、最近感受和前言一、使用能够快速得到重建初始化的方法1.1 Colmap(多视角)1.2 深度估计(单视角)二、已知形状模板2.1 人脸2.2 人体2.3 动物三、刚性与非刚性约束(变形约束)3.1 刚性变形3.2 非刚性变形四、统计(深度学习)先验——从大量(3D)数据中提取信息…...

渗透利器:YAKIT 工具-基础实战教程.

YAKIT 工具-基础实战教程. YAKIT&#xff08;Yak Integrated Toolkit&#xff09;是一款基于Yak语言开发的集成化网络安全单兵工具&#xff0c;旨在覆盖渗透测试全流程&#xff0c;提供从信息收集、漏洞扫描到攻击实施的自动化支持。其核心目标是通过GUI界面降低Yak语言的使用…...

Kotlin 2.1.0 入门教程(二十一)数据类

数据类 数据类主要用于存储数据。 对于每个数据类&#xff0c;编译器会自动生成一些额外的成员函数&#xff0c;这些函数支持将实例打印为易读的输出、比较实例、复制实例等操作。 数据类使用 data 关键字标记&#xff1a; data class User(val name: String, val age: Int…...

Python学习心得数据的验证

数据的验证是指程序对用户输入的数据进行”合法“性验证 一、 数据的验证的一些方法&#xff1a; 方法名 描述说明 str.isdigit() 所有字符都是数字(阿拉伯数字) str.isnumeric() 所有字符都是数字 str.isalpha() 所有字符都是字母(包含中文字符) str.isalnum() 所有…...

PyQt6/PySide6 的信号与槽原理

一、核心原理剖析 1.1 观察者模式的GUI实现 信号与槽机制基于观察者模式实现解耦通信&#xff0c;相比传统GUI回调机制具备&#xff1a; 类型安全&#xff1a;信号参数与槽参数自动匹配松耦合&#xff1a;发送者无需知道接收者存在多对多连接&#xff1a;一个信号可绑定多个…...

jenkins 配置ssh拉取gitlab

一、生成key ssh-keygen -t rsa -b 4096 -C "root" 二、将id_rsa内容拷贝到jenkins 公钥id_rsa.pub拷贝到gitlab...

基于css实现正六边形的三种方案

方案一&#xff1a;通过旋转三个长方形生成正六边形 分析&#xff1a; 如下图所示&#xff0c;我们可以通过旋转三个长方形来得到一个正六边形。疑问&#xff1a; 1. 长方形的宽高分别是多少&#xff1f; 设正六边形的边长是100&#xff0c;基于一些数学常识&#xff0c;可以…...

18.Python实战:实现年会抽奖系统

目录结构 python/ ├── sql/ │ └── table.sql # 创建数据库及数据表 ├── config/ │ └── __init__.py # 数据库和Flask配置 ├── static/ │ ├── style.css # 样式文件 │ └── script.js # JavaScript脚本…...

145,【5】 buuctf web [GWCTF 2019]mypassword

进入靶场 修改了url后才到了注册页面 注测后再登录 查看源码 都点进去看看 有个反馈页面 再查看源码 又有收获 // 检查$feedback是否为数组 if (is_array($feedback)) {// 如果是数组&#xff0c;弹出提示框提示反馈不合法echo "<script>alert(反馈不合法);<…...

19.4.9 数据库方式操作Excel

版权声明&#xff1a;本文为博主原创文章&#xff0c;转载请在显著位置标明本文出处以及作者网名&#xff0c;未经作者允许不得用于商业目的。 本节所说的操作Excel操作是讲如何把Excel作为数据库来操作。 通过COM来操作Excel操作&#xff0c;请参看第21.2节 在第19.3.4节【…...

什么是AI Agent的身份安全问题

什么是AI Agent的身份安全问题 AI发展背景与趋势 DeepSeek大模型R1成果引发关注,同时AI Agent元年到来,其应用将呈指数级上升,但也带来安全问题,如身份冒用风险。OpenAI创始人强调人工智能规模定律持续有效,AI Agent发展引发广泛关注,不过AI教母李飞飞指出其应定位为工…...

3.2 企业级AI Agent数据科学实战:从数据清洗到模型服务的全链路工业级方案

企业级AI Agent数据科学实战:从数据清洗到模型服务的全链路工业级方案 引言:数据科学家的Agent开发革命 IDC报告显示,优秀的数据处理流程可使大模型效果提升37%,模型推理成本降低58%。本文将揭示企业级Agent开发中数据科学家的核心方法论,通过GitHub Sentinel等案例,展…...

CAS单点登录(第7版)7.授权

如有疑问&#xff0c;请看视频&#xff1a;CAS单点登录&#xff08;第7版&#xff09; 授权 概述 授权和访问管理 可以使用以下策略实施授权策略以保护 CAS 中的应用程序和依赖方。 服务访问策略 服务访问策略允许您定义授权和访问策略&#xff0c;以控制对向 CAS 注册的…...

C语言中的对象、左值、右值、序列点、副作用的概念

对象 赋值表达式的目的就是把数据存储到内存位置上&#xff0c;用于存储值的数据区域统称数据对象 左值 左值是C语言中的术语&#xff0c;用于标识特定数据对象的名字。因此&#xff0c;对象指的是实际的数据存储&#xff0c;而左值是用于标识或定位存储位置的标签。 右值 …...

java集合框架之Map系列

前言 首先从最常用的HashMap开始。HashMap是基于哈希表实现的&#xff0c;使用数组和链表&#xff08;或红黑树&#xff09;的结构。在Java 8之后&#xff0c;当链表长度超过阈值时会转换为红黑树&#xff0c;以提高查询效率。哈希冲突通过链地址法解决。需要明确的是&#xff…...

【MediaTek】 T750 openwrt-23.05编 cannot find dependency libexpat for libmesode

MediaTek T750 T750 采用先进的 7nm 制程,高度集成 5G 调制解调器和四核 Arm CPU,提供较强的功能和配置,设备制造商得以打造精巧的高性能 CPE 产品,如固定无线接入(FWA)路由器和移动热点。 MediaTek T750 平台是一款综合的芯片组,集成了 5G SoC MT6890、12nm 制程…...

EasyX学习笔记1:线条

目录 一、线条颜色1. setlinecolor - 设置当前线条颜色2. getlinecolor - 获取当前线条颜色 二、线条样式1. setlinestyle - 设置线条样式&#xff08;宽度、类型等&#xff09; 三、绘制线条1. line - 绘制两点间直线2. lineto - 从当前位置画线到指定点3. linerel - 相对当前…...

HTML、Vue和PHP文件的区别与联系

一、核心区别 类型性质执行环境功能特点.html静态标记语言浏览器直接解析定义页面结构和内容,无逻辑处理能力.vue前端框架组件文件浏览器/构建工具整合HTML模板+JS逻辑+CSS样式,支持动态数据绑定和组件化开发.php服务器端脚本语言文件Web服务器执行动态生成HTML内容,支持数据…...

C#windows窗体人脸识别

一、创建一个数据库&#xff0c;名为TestFaceDB 里面有一张表就OK了&#xff0c;表名Users,表里面有几个字段我说明一下&#xff1a; id--------------------bigint----------------------编号 name--------------varchar(50)-----------------用户名 phone--------------v…...

53倍性能提升!TiDB 全局索引如何优化分区表查询?

作者&#xff1a; Defined2014 原文来源&#xff1a; https://tidb.net/blog/7077577f 什么是 TiDB 全局索引 在 TiDB 中&#xff0c;全局索引是一种定义在分区表上的索引类型&#xff0c;它允许索引分区与表分区之间建立一对多的映射关系&#xff0c;即一个索引分区可以对…...

vue字符串的常用方法,截取字符串,获取字符串长度,检索字符串

1.使用substr方法截取字符串 let str "12345"; let part str.substr(0, 3); // 截取从索引0开始到索引3的子字符串 console.log(part); // "123" 2.获取字符串长度 JavaScript中的字符串有一个 length属性&#xff0c;该属性可以用在VUE获取字符串的长度…...

Neo4j集群学习

文章目录 官方指导文档Neo4j因果集群核心服务器只读副本因果一致性 Neo4j集群搭建Neo4j企业版下载集群简介虚拟机准备jdk安装实施搭建访问neo4j Web服务 集群添加Core节点 官方指导文档 Neo4j 5 ClusterNeo4j 5 Basic Cluster Neo4j因果集群 集群是Neo4企业版中所提供的功能…...

【人工智能】深度学习中的梯度检查:原理详解与Python实现

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 梯度检查是深度学习模型开发中至关重要的一步,它能够验证反向传播的梯度计算是否正确,从而确保模型训练的稳定性和准确性。在本文中,我们…...