Ollama 部署本地大语言模型
一、下载安装ollama
1.百度 ollama
Ollama


2.点击下载
可以复制下载链接,使用下载器下载。

3.双击安装
默认安装目录:C:\Users\用户名\AppData\Local\Programs\Ollama

二、更改模型下载目录
0.默认下载目录 (跳过)
之前没下载过模型,不涉及转移模型,可以跳过此步骤
C:\Users\用户名\.ollama\models\
如果之前下载过了,可将默认目录里的

复制到更改后的目录里
1.打开系统属性
右键点击桌面上的“此电脑”或“计算机”图标,选择“属性”。

2.进入高级系统设置
在系统属性窗口中,点击左侧的“高级系统设置”按钮。

3.编辑环境变量

4.新建环境变量
在“环境变量”窗口中,找到“系统变量”部分,点击“新建”按钮。
输入变量名为OLLAMA_MODELS。
在“变量值”文本框中输入希望保存模型文件的新目录路径,例如D:\OllamaModels。

5.保存并重启Ollama
点击“确定”按钮保存设置。
重启Ollama应用,以使新的环境变量生效。
为了保证生效,可以重启电脑。
三、常用命令
1.win+R键--->cmd
输入 ollama

这是Ollama命令行工具的帮助信息,它列出了所有可用的命令和标志,以及如何使用它们。以下是对这些命令和标志的详细解释:
命令
- serve
- 描述:启动Ollama服务,使其能够处理模型运行和API请求。
- 用法:
ollama serve
- create
- 描述:使用包含模型信息的Modelfile来创建一个新模型。
- 用法:
ollama create /path/to/Modelfile
- show
- 描述:显示特定模型的详细信息,如模型名称、版本等。
- 用法:
ollama show [模型名称]
- run
- 描述:运行一个已安装的模型,执行某些任务。
- 用法:
ollama run [模型名称]
- stop
- 描述:停止一个正在运行的模型。
- 用法:
ollama stop [模型名称]
- pull
- 描述:从模型注册表中拉取一个模型到本地使用。
- 用法:
ollama pull [模型名称]
- push
- 描述:将本地模型推送到模型注册表中,以便他人或其他系统使用。
- 用法:
ollama push [模型名称]
- list
- 描述:列出本地所有可用的模型。
- 用法:
ollama list或ollama ls
- ps
- 描述:列出当前正在运行的模型。
- 用法:
ollama ps
- cp
- 描述:复制一个模型到另一个位置或给定名称的地方。
- 用法:
ollama cp [原模型名称] [新模型名称]
- rm
- 描述:删除一个已安装的模型。
- 用法:
ollama rm [模型名称]
- help
- 描述:获取有关Ollama任何命令的帮助信息。
- 用法:
ollama help [命令名称]或ollama --help
标志
- -h, --help
- 描述:显示帮助信息,包括所有可用命令和标志。
- 用法:在任何命令后添加
-h或--help以获取该命令的详细帮助信息。
- -v, --version
- 描述:显示Ollama工具的版本信息。
- 用法:
ollama -v或ollama --version
注意: create命令,可以基于某个模型创建指定角色的模型。
具体用法可以搜索:
ollama create怎么用?
ollama
四、下载模型
1.搜索模型




2.下载模型
(模型越大功能越强,但是所需要的电脑硬件设备越高,根据个人情况自行选择)
命令粘贴的到 命令窗口(win+R键--->cmd)
ollama run deepseek-r1:7b

下载慢怎么办?
第一步
点击选中终端窗口,然后点击 ctr+c 暂停下载。
第二步
重新粘贴 命令 ,等待重新链接即可。
注意事项:
有小概率出现从头开始下载的可能性,目前题主暂未出现此情况。
五、测试
run命令 运行存在的模型就是打开,不存在的模型,就是先下载再打开。

可直接在此窗口进行对话
六、基于已有模型,创造模型
github有教程 ,ollama github页面搜索 Create a Modelfile 定位到指定位置。
在Ollama中,你还可以自定义模型的启动提示词来调整其行为。例如,要自定义 deepseek模型,你首先需要拉取(下载)该模型:(上面操作已经下载过了,跳过)
ollama pull deepseek-r1:7b
创建一个Modelfile,在其中设置参数和系统消息:
FROM deepseek-r1:7b# 设置创造力参数,1表示更高的创造性,较低则表示更加连贯
PARAMETER temperature 1# 设置系统消息
SYSTEM """
You are Mario from Super Mario Bros. Answer as Mario, the assistant, only.
"""
创建并运行自定义模型:
ollama create custom-model-name -f F:\路径\Modelfile ollama run custom-model-name
七、安装web UI
1.搜索 page Assist github



2.解压
3.Chrome浏览器加载插件

4.Ctrl+Shift+L 打开
5.设置中文


6.RAG设置

Ollama 下载 模型
ollama pull nomic-embed-text
刷新当前页面


可以设置联网或上传图片等。
八、Ollama手动导入GGUF模型文件
1.下载模型文件
进入该网站https://huggingface.co/
(其他平台)
点击模型

直接搜索模型关键词,以QWen2.5 GGUF为例



可以复制下载链接,到下载器下载
2.创建一个Modelfile
在其中设置参数和系统消息:

# 指定本地模型的位置
FROM F:\ollama\QWen_GGUF\Qwen2.5-1.5B-Instruct.Q5_K_S.gguf# 指定模型参数
PARAMETER temperature 0.7# 设置系统消息,定义助手行为
SYSTEM """
You are a helpful assistant.
"""
3.执行以下命令
ollama create QWen_2.5_gguf -f F:\ollama\QWen_GGUF\qw_Modelfile
ollama run custom-model-name
4.注意
page Assist使用时,从新配置设置一遍,否则可能出现不智能的情况
九、使用API方式远程调用ollama模型
1.设置环境变量(参考第二步)
OLLAMA_HOST="0.0.0.0:11434"
2.命令
ollama serve
3.配置防火墙(可选)
-
如果希望从外部网络访问 Ollama server,需要在 Windows 防火墙中开放 Ollama 使用的端口(默认是
11434)。 -
打开“控制面板” -> “系统和安全” -> “Windows Defender 防火墙”,点击“高级设置”,在“入站规则”中创建一条新的规则,允许 TCP 端口
11434的入站连接。
3.下载客户端
①搜索chatbox
Chatbox AI官网:办公学习的AI好助手,全平台AI客户端,官方免费下载
②下载
③下一步、下一步安装就行
4.配置客户端
设置好IP、端口后保存.
5、测试
略
相关文章:
Ollama 部署本地大语言模型
一、下载安装ollama 1.百度 ollama Ollama 2.点击下载 可以复制下载链接,使用下载器下载。 3.双击安装 默认安装目录:C:\Users\用户名\AppData\Local\Programs\Ollama 二、更改模型下载目录 0.默认下载目录 (跳过) 之前没下载过模型,不…...
Jackson扁平化处理对象
POJO对象 Data public class People {private PeopleInfo peopleInfo;private List<String> peopleIds;private Map<String, String> peopleMap;Datapublic static class PeopleInfo {private String name;private String address;} }JSON序列化处理 直接将对象进…...
在 Ubuntu 上安装 MySQL 的详细指南
在Ubuntu环境中安装 mysql-server 以及 MySQL 开发包(包括头文件和动态库文件),并处理最新版本MySQL初始自动生成的用户名和密码,可以通过官方的APT包管理器轻松完成。以下是详细的步骤指南,包括从官方仓库和MySQL官方…...
pytest-xdist 进行多进程并发测试!
在软件开发过程中,测试是确保代码质量和可靠性的关键步骤。随着项目规模的扩大和复杂性的增加,测试用例的执行效率变得尤为重要。为了加速测试过程,特别是对于一些可以并行执行的测试用 例,pytest-xdist 提供了一种强大的工具&…...
24.ppt:小李-图书策划方案【1】
目录 NO1234 NO5678 NO1234 新建PPT两种方式👇docx中视图→导航窗格→标题1/2/3ppt新建幻灯片→从大纲→重置开始→版式设计→主题插入→表格 NO5678 SmartArt演示方案:幻灯片放映→自定义幻灯片放映→新建→选中添加...
模型 替身决策
系列文章分享模型,了解更多👉 模型_思维模型目录。替身决策,换位思考,多角度决策。 1 替身决策模型的应用 1.1 替身决策模型在面试中的应用-小李的求职面试 小李是一名应届毕业生,正在积极寻找工作机会。在面试过程中…...
ESP32S3读取数字麦克风INMP441的音频数据
ESP32S3 与 INMP441 麦克风模块的集成通常涉及使用 I2S 接口进行数字音频数据的传输。INMP441 是一款高性能的数字麦克风,它通过 I2S 接口输出音频数据。在 Arduino 环境中,ESP32S3 的开发通常使用 ESP-IDF(Espressif IoT Development Framew…...
docker环境下部署face-search开源人脸识别模型
由于我们是直接将face-search部署在docker容器中的,所以,在部署之前一定要检查一下自己的docker环境,要不然部署过程中会出现各种各样的问题 我这里的docker环境是 一、安装docker环境 如果docker版本比较低或者docker-compose的版本比较低的情况下,部署的时候docker的yml…...
301.华为交换机堆叠技术基础
华为交换机堆叠技术基础 一、概念及原理部分1.堆叠简介1.1 什么是堆叠1.2 可靠性网络架构1.3 华为堆叠设备1.4 其他厂商的堆叠2.堆叠的示意图3.堆叠的应用3.1 中小企业3.2 园区网4.堆叠的原理4.1基本的概念4.2 堆叠建立4.3 角色选举4.4 版本同步4.5 配置同步4.6 堆叠系统的登录…...
【数据库创建】用ij工具部署Derby数据库并验证
Java有一个内置的Derby数据库,是一个完全用Java语言编写的、功能强大的微型数据库,其基础引擎和内嵌的JDBC驱动总共大约2MB大小。Derby为用户提供了轻量的标准数据库引擎,它可以紧密地嵌入到任何基于Java的解决方案中。 Derby的特性令人惊奇&…...
飞牛fnOS安装了Airplay没有声音找不到声卡的问题
主要问题描述:我在飞牛的Docker里安装了 Airplay, 这样把NAS接一个外接音箱,就可以当成无线音箱来用,直接把手机的音乐播放投到上面来播放。 (文章底部有写我是怎么安装Airplay的) 我的报错如下࿱…...
netcore openTelemetry+prometheus+grafana
一、netcore项目 二、openTelemetry 三、prometheus 四、grafana添加Dashborad aspire/src/Grafana/dashboards at main dotnet/aspire GitHub 导入:aspnetcore.json和aspnetcore-endpoint.json 效果:...
全程Kali linux---CTFshow misc入门(38-50)
第三十八题: ctfshow{48b722b570c603ef58cc0b83bbf7680d} 第三十九题: 37换成1,36换成0,就得到长度为287的二进制字符串,因为不能被8整除所以,考虑每7位转换一个字符,得到flag。 ctfshow{5281…...
DeepSeek与人工智能的结合:探索搜索技术的未来
云边有个稻草人-CSDN博客 目录 引言 一、DeepSeek的技术背景 1.1 传统搜索引擎的局限性 1.2 深度学习在搜索中的优势 二、DeepSeek与人工智能的结合 2.1 自然语言处理(NLP) 示例代码:基于BERT的语义搜索 2.2 多模态搜索 示例代码&…...
用 DeepSeek + Kimi 自动做 PPT,效率起飞
以下是使用 DeepSeek Kimi 自动做 PPT 的详细操作步骤: 利用 DeepSeek 生成 PPT 内容: 访问 DeepSeek 官网,完成注册/登录后进入对话界面。输入指令,例如“请用 Markdown 格式生成一份关于[具体主题]的 PPT 大纲,需包…...
LeetCode 每日一题 2025/2/3-2025/2/9
记录了初步解题思路 以及本地实现代码;并不一定为最优 也希望大家能一起探讨 一起进步 目录 2/3 680. 验证回文串 II2/4 922. 按奇偶排序数组 II2/5 90. 子集 II2/6 47. 全排列 II2/7 59. 螺旋矩阵 II2/8 63. 不同路径 II2/9 80. 删除有序数组中的重复项 II 2/3 680…...
自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
目录 1、引言 2、主要内容 2.1、定位对比:感知与规划的全维覆盖 2.2、数据与技术特性对比 2.3、技术协同:构建全栈研发生态 2.4、应用场景与评估体系 2.5、总结与展望 3、参考文献 1、引言 随着自动驾驶技术向全栈化迈进,Motional 团…...
设计模式 ->模板方法模式(Template Method Pattern)
模板方法模式 模板方法模式是一种行为设计模式,它在一个方法中定义一个操作的算法骨架,而将一些步骤延迟到子类中实现。它允许子类在不改变算法结构的情况下重新定义算法中的某些步骤 特点 算法骨架: 在基类中定义算法的框架延迟实现&…...
DeepSeekMoE 论文解读:混合专家架构的效能革新者
论文链接:DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models 目录 一、引言二、背景知识(一)MoE架构概述(二)现有MoE架构的问题 三、DeepSeekMoE架构详解(一&a…...
机器学习之心的创作纪念日
机缘 今天,是我成为创作者的第1460天。 在这段时间里,获得了很大的成长。 虽然日常忙碌但还在坚持创作、初心还在。 日常 创作已经成为我生活的一部分,尤其是在我的工作中,创作是不可或缺的,创作都是核心能力之一。…...
【python】简单的flask做页面。一组字母组成的所有单词。这里的输入是一组字母,而输出是所有可能得字母组成的单词列表
目录结构如下: https://github.com/kaede316/Pythons_pj.git 效果: 后续可扩展为工具网站: 更新 2025.02.09 1、增加等间距制作人 时间信息 2、增加判断润年的功能...
[权限提升] Linux 提权 维持 — 系统错误配置提权 - Sudo 滥用提权
关注这个专栏的其他相关笔记:[内网安全] 内网渗透 - 学习手册-CSDN博客 0x01:Sudo 滥用提权原理 Sudo 是一个 Linux 系统管理命令,它允许系统管理员授予普通用户以指定身份执行指定命令的权限。该命令不仅减少了 Root 用户的登录时间和管理时…...
【算法】快速排序算法的实现:C 和 C++ 版本
1. 算法简介 快速排序(Quick Sort)是由英国计算机科学家霍尔(C.A.R. Hoare)在1960年提出的一种高效的排序算法。它采用了分治法(Divide and Conquer)策略,通常具有很好的性能。在平均情况下,快速排序的时间复杂度为 O(n log n),但在最坏情况下可能退化为 O(n^2),不过…...
如何修改IDEA的maven远程仓库地址
IDEA自动的maven的远程仓库地址为国外地址,导致下载依赖时很慢,通过如下方法可以将其修改为国内地址 选中模块,右击,创建setting.xml文件 添加阿里仓库地址 <mirrors><mirror><id>nexus-aliyun</id><…...
LLMs之DeepSeek r1:TinyZero(复现 DeepSeek R1 Zero 的核心功能)的简介、安装和使用方法、案例应用之详细攻略
LLMs之DeepSeek r1:TinyZero(复现 DeepSeek R1 Zero 的核心功能)的简介、安装和使用方法、案例应用之详细攻略 目录 TinyZero的简介 1、TinyZero的特点 TinyZero的安装和使用方法 1、安装 创建 conda 环境 数据准备 (倒计时任务) 训练执行 单GPU (适用于模型…...
亚博microros小车-原生ubuntu支持系列:23 人脸识别追踪
背景知识: 本节跟上一篇的物体识别追踪类似,换了opencv的函数来做人脸识别 函数定义如下: detectMultiScale(image, scaleFactor, minNeighbors, flags, minSize, maxSize)scaleFactor参数控制每个图像序列的缩放比例。该参数决定了在每个…...
[7] 游戏机项目说明
[7] 游戏机项目说明 在这节课中,我们将学习如何基于FreeRTOS开发一个简单的游戏项目。我们会使用一个开源项目nwatch,它是一个基于STM32的开源手表,包含了三个游戏。我们的目标是将这个游戏移植到我们的开发板上,并逐步使用FreeR…...
Kubernetes之kube-proxy运行机制分析
一、基础知识 1.Kubernetes再创建服务时会为服务分配一个虚拟IP地址,客户端通过这个虚拟Ip地址来访问服务,而服务则负责将请求转发到后端pod上。 2.上述阐述的过程为一个反向代理的过程,但是这个反向代理和普通的反向代理的区别是它的IP地址是…...
微信小程序调用企业微信客户服务插件联通企业微信客服
需求背景:用户在小程序页面点击按钮添加企业微信的客服 相关技术:基于uniapp开发的微信小程序 插件名称:企业微信客户服务插件「联系我」插件 - 文档 - 企业微信开发者中心 仔细阅读文档「联系我」插件 - 文档 - 企业微信开发者中心 以下是我的实例代码 1.首先先小程序管…...
如何解决 javax.xml.crypto.dsig.TransformException: 转换异常问题?亲测有效的解决方法!
1. 问题分析 1.1 异常描述 javax.xml.crypto.dsig.TransformException 是在使用 Java XML 加密和签名 API 时,发生的一个常见异常。它通常出现在 XML 数字签名的转换过程中,可能是由于签名、加密或验证过程中发生了错误。 1.2 异常场景 该异常通常发…...

