当前位置：首页 > news >正文

Ollama 运行从 ModelScope 下载的 GGUF 格式的模型

news 2026/5/16 4:54:56

本文系统环境

Windows 10

Ollama 0.5.7

Ollama 是什么？

Ollama 可以让你快速集成和部署本地 AI 模型。它支持各种不同的 AI 模型，并允许用户通过简单的 API 进行调用

Ollama 的安装

Ollama 官网有其下载及安装方法，非常简便

但如果希望不占用系统盘大量空间，可以参考 Ollama Windows 文档这样安装

1. 把 Ollama 安装到其它磁盘

命令行定位到 Ollama 安装包 OllamaSetup.exe 的目录下，运行如下命令，指定你希望的安装目录

OllamaSetup.exe /DIR="D:\Program Files\Ollama"

2. 更改 Ollama 的模型存放位置

Ollama 后续下载安装的模型默认存放在系统盘，会非常占用位置

设置 OLLAMA_MODELS 系统变量，指定希望的模型存放目录

设置完后，如果 Ollama 服务已在运行，要重启一下 Ollama 服务方能生效

从 ModelScope 下载模型并加载

Ollama 官方安装模型的方法很简单

例如：

ollama run qwen2.5

但下载速度一般非常慢

我们可以从 ModelScope 先下载模型，再通过 Ollama 加载模型

1. 下载 GGUF 格式模型

Ollama 能轻易加载 GGUF 格式的模型，检索 GGUF 模型进行下载

推荐用官方命令行方式下载，下载过程中有进度条，可指定下载目录

modelscope download --model 'Qwen/Qwen1.5-0.5B-Chat-GGUF' --local_dir 'D:\Models\Qwen1.5-0.5B-Chat-GGUF'

下载完成后，目录类似这样：

关于 gguf 文件，简单理解就是体积越大的回答准确率就越高

2. 加载 GGUF 模型

参考 Ollama 关于加载 GGUF 的说明和 Qwen 官网关于 Ollama 加载 GGUF 模型的文档

在上述下载 gguf 模型的目录中新建一个名为 Modelfile 的文件

Modelfile 文件内容如下

FROM ./qwen1_5-0_5b-chat-q5_0.gguf

在 gguf 模型的目录下运行 Ollama 加载 gguf 的命令

ollama create qwen1.5:0.5b -f Modelfile

至此，在上面 OLLAMA_MODELS 系统变量对应的目录下会生成 Ollama 的模型数据

Ollama 运行模型

由于 Ollama 已安装，因此 ollama 命令可用

ollama run qwen1.5:0.5b

Ollama 运行从 ModelScope 下载的 GGUF 格式的模型

本文系统环境 Windows 10 Ollama 0.5.7 Ollama 是什么？ Ollama 可以让你快速集成和部署本地 AI 模型。它支持各种不同的 AI 模型，并允许用户通过简单的 API 进行调用 Ollama 的安装 Ollama 官网有其下载及安装方法，非常简便但如果希…...

编程日记 2025/1/30 6:42:06

Haproxy介绍及学习

一、负载均衡(load balance)： 1.一种服务基于硬件设备实现的高可用反向代理技术，将特定的业务分担给指定的一个或者多个后端特定的服务器，提高了业务的并发处理能力保证业务的高可用并方便对业务后期的水平动态扩展性。 2.使用负载均衡的原因…...

编程日记 2025/1/30 6:30:45

【2024年华为OD机试】 (C卷,200分)- 贪心歌手（JavaScriptJava PythonC/C++）

一、问题描述问题描述一个歌手需要从A城前往B城参加演出，必须在T天内到达。途中会经过N座城市，且不能往回走。每两座城市之间的行程天数已知。歌手在每座城市都可以卖唱赚钱，但收入会随着停留天数的增加而递减。具体来说，第一…...

编程日记 2025/1/30 6:28:34

深度学习在金融风控中的应用：突破传统模型的瓶颈

深度学习在金融风控中的应用：突破传统模型的瓶颈金融风险控制（简称“风控”）是现代金融体系中至关重要的一环，关系到金融机构的稳定性、客户的安全以及整体经济的健康运行。近年来，随着深度学习的迅猛发展，传统的风控模型正面临被颠覆的挑战，新的技术手段和思维方式正…...

编程日记 2025/1/30 6:27:22

LLM - 大模型 ScallingLaws 的指导模型设计与实验环境(PLM) 教程(4)

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/145323420 免责声明：本文来源于个人知识与公开资料，仅用于学术交流，欢迎讨论，不支持转载。 Scaling Laws (缩放法则) 是大模型领域中，用于描述模型性能(Loss) 与…...

编程日记 2025/1/30 6:25:17

hunyuan 混元学习

使用了5个subset,也是用了text-image和text-video进行训练的也是进行了复杂的视频选择。同movie gen. 也进行了模型切断，用拉普拉斯算子找到最清晰的一帧作为训练的起始训练了不同的模型去选择数据，比如用Dover去选择美观度比较好的数据&#xff0c…...

编程日记 2025/1/30 6:23:09

开发、科研工具汇总

一些基础教程网站 W3：w3school 在线教程菜鸟：菜鸟教程 - 学的不仅是技术，更是梦想！ 开发相关参考文档 Vue2：Vue.js Vue3：Vue.js - 渐进式 JavaScript 框架 | Vue.js MDN：MDN Web Docs HT…...

编程日记 2025/1/30 6:19:01

项目部署(springboot项目)

1、安装Nginx，并开启 2、前端项目打包：npm run build:prod--->dist 3、后端项目打包：install--->xxx.jar 4、开放需要的端口号：比如我的后端项目端口号为8282，则需要防火墙和服务器同时开发8282端口 5、将di…...

编程日记 2025/1/30 6:16:50

OpenEuler学习笔记（十四）：在OpenEuler上搭建.NET运行环境

一、在OpenEuler上搭建.NET运行环境基于包管理器安装添加Microsoft软件源：运行命令sudo rpm -Uvh https://packages.microsoft.com/config/centos/8/packages-microsoft-prod.rpm，将Microsoft软件源添加到系统中，以便后续能够从该源安装.…...

编程日记 2025/1/30 6:08:41

神经网络的通俗介绍

人工神经网络，是一种模仿人类大脑工作原理的数学模型。人类的大脑是由无数的小“工作站”组成的，每个工作站叫做“神经元”。这些神经元通过“电线”互相连接，负责接收、处理和传递信息。一、人类大脑神经网络人类大脑的神经网络大概长这…...

编程日记 2025/1/30 6:05:26

基于 AWS SageMaker 对 DeepSeek-R1-Distilled-Llama-8B 模型的精调与实践

在当今人工智能蓬勃发展的时代，语言模型的性能优化和定制化成为研究与应用的关键方向。本文聚焦于 AWS SageMaker 平台上对 DeepSeek-R1-Distilled-Llama-8B 模型的精调实践，详细探讨这一过程中的技术细节、操作步骤以及实践价值。一、实验背景与目标 …...

编程日记 2025/1/30 6:03:18

如何使用DeepSeek R1

以下是如何使用DeepSeek R1的详细步骤： ### 一、注册DeepSeek账户 1. **访问官方网站**： - 打开浏览器，访问[chat.deepseek.com](http://chat.deepseek.com)。 2. **注册账户**： - 使用电子邮件、Google账户或86手机号码…...

编程日记 2025/1/30 6:02:10

大屏 UI 设计风格的未来趋势

在科技飞速革新的时代，大屏设备的应用领域不断拓展，从城市的智能交通指挥中心，到商场的互动广告大屏，再到家庭的超大尺寸智能电视，大屏已然成为信息展示与交互的关键载体。大屏 UI 设计风格也随之不断演变，…...

编程日记 2025/1/30 6:00:05

unity学习22：Application类其他功能

目录 1 是否允许后台运行 1.1 Application.runInBackground，显示是否允许后台运行 1.2 设置的地方 2 打开URL 2.1 Application.OpenURL("") 打开超链接 3 退出游戏 3.1 Application.Quit() 退出游戏 4 场景相关 5 返回游戏状态 6 控制游戏的行…...

编程日记 2025/1/30 5:55:59

51单片机入门_02_C语言基础0102

C语言基础部分可以参考我之前写的专栏C语言基础入门48篇以及《从入门到就业C全栈班》中的C语言部分，本篇将会结合51单片机讲差异部分。课程主要按照以下目录进行介绍。文章目录 1. 进制转换2. C语言简介3. C语言中基本数据类型4. 标识符与关键字5. 变量与常量6.…...

编程日记 2025/1/30 5:53:56

定位的叠放次序 z-index

浮动定位和绝对定位的区别： 浮动只会压住它下面标准流的盒子，但是不会压住下面标准流盒子里面的文字，但是绝对定位（固定定位）会压住下面标准流所有的内容。...

编程日记 2025/1/30 5:51:53

ESP32-S3模组上跑通esp32-camera（36）

接前一篇文章：ESP32-S3模组上跑通esp32-camera（35）一、OV5640初始化 2. 相机初始化及图像传感器配置上一回继续对reset函数的后一段代码进行解析。为了便于理解和回顾，再次贴出reset函数源码，在components\esp32-camera\sensors\ov5640.c中，如下： static int reset…...

编程日记 2025/1/30 5:46:48

前端性能优化：HMR热更新和预获取加载

最近发现项目开发，有点加载快，有点却是卡机式，甚至刷新导致白屏情况。于是，我找开发和性能优化的方法，找到下面几种。本文将深入探讨预获取（Prefetch）、动态导入（Dynamic Import&…...

编程日记 2025/1/30 5:45:47

【自学笔记】计算机网络的重点知识点-持续更新

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录计算机网络重点知识点一、计算机网络概述二、网络分类三、网络性能指标四、网络协议与体系结构五、数据交换方式六、物理层与数据链路层七、网络层与运输层八、应用…...

编程日记 2025/1/30 5:43:45

算法基础学习——二分查找（附带Java模板）

有单调性的数列一定可以使用二分，没有单调性的题目也可能可以使用二分； （一）整数二分二分的本质： 在某个整数区间内，存在某种性质使得区间内左半边的数都不满足该性质；而右半边的数都满足该性…...

编程日记 2025/1/30 5:40:41

告别枯燥表格！用Power BI的矩形树图，5分钟搞定你的销售利润可视化分析

商业数据可视化实战：用Power BI矩形树图5分钟呈现销售利润洞察在每周的销售复盘会议上，你是否经常面对这样的困境：手头有一份密密麻麻的Excel表格，包含了各省市、各产品的销售利润数据，却难以快速向团队传达关键业务洞…...

编程新知 2026/5/16 4:54:51

Go语言策略模式：算法替换 1. 策略接口 type SortStrategy interface {Sort(data []int) []int }type BubbleSort struct{}func (s *BubbleSort) Sort(data []int) []int {// 冒泡排序实现return data }type QuickSort struct{}func (s *QuickSort) Sort(data []int)…...

编程新知 2026/5/16 3:05:38

终极指南：5分钟掌握Illustrator批量替换神器ReplaceItems.jsx，效率提升20倍

终极指南：5分钟掌握Illustrator批量替换神器ReplaceItems.jsx，效率提升20倍【免费下载链接】illustrator-scripts Adobe Illustrator scripts 项目地址: https://gitcode.com/gh_mirrors/il/illustrator-scripts 如果你正在寻找能够大幅提升Adob…...

编程新知 2026/5/16 2:54:49

终极raylib游戏开发指南：如何在3天内从零到一创建跨平台游戏

终极raylib游戏开发指南：如何在3天内从零到一创建跨平台游戏【免费下载链接】raylib A simple and easy-to-use library to enjoy videogames programming 项目地址: https://gitcode.com/GitHub_Trending/ra/raylib raylib是一个简单易用的轻量级游戏编程库…...

编程新知 2026/5/16 2:48:41

为什么顶尖社会学期刊编辑开始拒收未使用AI辅助验证的民族志推论？（NotebookLM可复现性协议首曝）

更多请点击： https://intelliparadigm.com 第一章：NotebookLM社会学研究辅助面向质性研究的语义增强工作流 NotebookLM 是 Google 推出的基于用户上传文档进行“可信引用”的 AI 助手，特别适用于社会学研究中对访谈转录稿、田野笔记、政策…...

编程新知 2026/5/16 2:46:27

大模型KV缓存量化技术：原理、优化与实践

1. KV缓存量化技术背景解析在Transformer架构的大语言模型(LLM)推理过程中，注意力机制的计算复杂度与序列长度呈平方关系增长。为优化这一过程，现代LLM服务系统普遍采用KV缓存(Key-Value Cache)技术，将注意力层计算过的键值对存储在内存中供后…...

编程新知 2026/5/16 1:42:25

互联网大厂 Java 求职面试：从 Spring Boot 到微服务与云原生的技术探讨

互联网大厂 Java 求职面试：从 Spring Boot 到微服务与云原生的技术探讨场景介绍：在一家知名互联网大厂的面试现场，面试官是一位严肃的技术专家，而候选人燕双非则是一位幽默风趣的程序员。面试官准备了一系列问题，涵盖…...

编程新知 2026/5/16 1:38:19

基于CircuitPython与Adafruit CLUE的创意灵感生成器开发指南

1. 项目概述：用硬件激发创意的火花你有没有过这样的时刻——面对空白的画布、闪烁的光标，或者一堆零散的电子元件，脑子里却一片空白，急需一个点子来点燃创作的引擎？这种“创意阻塞”几乎是每个创作者都会遇到的难题。传…...

编程新知 2026/5/15 23:24:51

高光谱图像分类避坑指南：Hughes现象、同物异谱，这些坑你踩过吗？

高光谱图像分类实战避坑手册：从Hughes现象到模型优化的深度解析当你的高光谱分类模型在验证集上表现优异，却在真实场景中频频失误时，或许正遭遇着这个领域特有的"暗礁"。不同于常规RGB图像分类，高光谱数据特有的图谱合…...

编程新知 2026/5/15 22:59:44

3步掌握：如何用HTML转Figma工具实现网页设计稿快速转换

3步掌握：如何用HTML转Figma工具实现网页设计稿快速转换【免费下载链接】figma-html Convert any website to editable Figma designs 项目地址: https://gitcode.com/gh_mirrors/fi/figma-html 你是否曾羡慕某个网站的布局设计，却苦于无法快速将…...

编程新知 2026/5/15 22:42:46