当前位置: 首页 > news >正文

如何自己构建 Ollama 模型

如何自己构建 Ollama 模型

  • 0. 引言
  • 1. 下载原始模型
  • 2. 创建 Modelfile 文件
  • 3. 构建 Ollama 模型
  • 4. 运行自构建的 Ollama 模型

0. 引言

针对模型新出的大模型,可能 Ollama Models Library 不提供,或者会在今后的某个时点提供。还有可能 Ollama Models Library 提供的模型有问题,或者我们想加入一些客户化的内容。上面这些情况,我们可能都需要自己构建一个 Ollama 模型。

今天我会以一个示例演示一下如何构建一个客户化 Ollama 模型。

1. 下载原始模型

今天的示例模型是 CohereForAI/c4ai-command-r-v01,我们先搜寻 gguf 格式的模型文件,找到这个链接,https://huggingface.co/andrewcanis/c4ai-command-r-v01-GGUF/tree/main,我们下载想使用的量化版本,比如,c4ai-command-r-v01-Q8_0.gguf

在这里插入图片描述

2. 创建 Modelfile 文件

创建一个 Modelfile 文件,比如 c4ai-command-r-v01-Q8_0.Modelfile,内容如下,

TEMPLATE 和 PARAMETER 的内容如何定义,需要查看各个模型页面的相关说明。

FROM ./c4ai-command-r-v01-Q8_0.gguf
TEMPLATE """<BOS_TOKEN>{{ if .System }}<|START_OF_TURN_TOKEN|><|SYSTEM_TOKEN|>{{ .System }}<|END_OF_TURN_TOKEN|>{{ end }}{{ if .Prompt }}<|START_OF_TURN_TOKEN|><|USER_TOKEN|>{{ .Prompt }}<|END_OF_TURN_TOKEN|>{{ end }}<|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>{{ .Response }}"""
PARAMETER stop "<|END_OF_TURN_TOKEN|>"

refer: https://github.com/ollama/ollama?tab=readme-ov-file
refer: https://github.com/ollama/ollama/pull/3190

3. 构建 Ollama 模型

执行下面命令构建 Ollama 模型,这个过程会花费一些时间,

ollama create cohereforai:c4ai-command-r-v01-Q8_0 -f .\c4ai-command-r-v01-Q8_0.Modelfile

在这里插入图片描述

4. 运行自构建的 Ollama 模型

通过 ollama run 模型运行自构建的 Ollama 模型,

ollama run cohereforai:c4ai-command-r-v01-Q8_0

在这里插入图片描述

完结!

相关文章:

如何自己构建 Ollama 模型

如何自己构建 Ollama 模型 0. 引言1. 下载原始模型2. 创建 Modelfile 文件3. 构建 Ollama 模型4. 运行自构建的 Ollama 模型 0. 引言 针对模型新出的大模型&#xff0c;可能 Ollama Models Library 不提供&#xff0c;或者会在今后的某个时点提供。还有可能 Ollama Models Lib…...

5.84 BCC工具之tcpretrans.py解读

一,工具简介 tcpretrans工具追踪内核TCP重传函数,以显示这些重传的详细信息。 它专门用于追踪TCP重传事件。在网络通信中,重传是由于数据包丢失、损坏或延迟到达而需要重新发送的情况。tcpretrans通过利用Linux内核中的BPF(Berkeley Packet Filter)机制,能够实时捕获和…...

从0到1实现RPC | 03 重载方法和参数类型转换

一、存在的问题 1.重载方法在当前的实现中还不支持&#xff0c;调用了会报错。 2.类型转换也还存在问题。 假设定义的接口如下&#xff0c;参数是float类型。 在Provider端接受到的是一个Double类型&#xff0c;这是因为web应用接收的请求后处理的类型。 在反射调用的时候就会…...

Matlab之已知2点绘制长度可定义的射线

目的&#xff1a;在笛卡尔坐标系中&#xff0c;已知两个点的位置&#xff0c;绘制过这两点的射线。同时射线的长度可以自定义。 一、函数的参数说明 输入参数&#xff1a; PointA&#xff1a;射线的起点&#xff1b; PointB&#xff1a;射线过的零一点&#xff1b; Length&…...

虚拟机安装Linux系统,FinalShell远程连接Linux

1.虚拟机安装CentOS系统 2. 查看CentOS系统的ip地址 3. FinalShell远程连接Linux 3.虚拟机快照&#xff08;存档&#xff09; 确保虚拟机关机&#xff0c;找到快照模拟器 恢复快照...

MacOS Xcode 使用LLDB调试Qt的 QString

环境&#xff1a; MacOS&#xff1a; 14.3Xcode&#xff1a; Version 15.0Qt&#xff1a;Qt 6.5.3 前言 Xcode 中显示 预览 QString 特别不方便, 而Qt官方的 lldb 脚本debugger/lldbbridge.py一直加载失败&#xff0c;其他第三方的脚本都 不兼容当前的 环境。所以自己研究写…...

C/C++代码性能优化——编程实践

1. 编程实践 在一些关键的地方&#xff0c;相应的编程技巧能够给性能带来重大提升。 1.1. 参数传递 传递非基本类型时&#xff0c;使用引用或指针&#xff0c;这样可以避免传递过程中发生拷贝。参数根据是否需要返回&#xff0c;相应加上const修饰&#xff0c;代码更安全&am…...

JVM—内存可见性

什么是可见性 可见性&#xff1a;一个线程对共享变量值的修改,能够及时地被其他线程看到共享变量&#xff1a;如果一个变量在多个线程的工作内存中都存在副本,那么这个变量就是这几个线程的共享变量 Java内存模型(JMM) Java内存模型(Java Memory Model)描述了Java程序中各种…...

VScode手动安装vsix格式插件,提示安装插件与code版本不兼容问题

问题描述: vscode手动按装插件提示"插件不兼容code版本 原因方案:修改安装包内的package.json文件中的版本号与vscode版本号对应即可 解决步骤 以(adpyke.codesnap-1.3.4.vsix)安装包为例 手动安装vscode弹出 无法安装扩展“adpyke.codesnap-1.3.4”&#xff0c;它与 …...

K8S Storage

概述 一般情况下&#xff0c;K8S中的Pod都不应该将数据持久化到Pod中&#xff0c;因为Pod可能被随时创建和删除&#xff08;扩容或缩容&#xff09;&#xff0c;即便是StatefulSet或Operator的Pod&#xff0c;也都不建议在Pod里存放数据&#xff0c;可以将数据持久化到Host上。…...

Day54-nginx限速-访问日志-错误日志精讲

Day54-nginx限速-访问日志-错误日志精讲 测试请求限制连接限制&#xff08;limit_conn&#xff09;下载速度限制(limit_rate) ngx_http_core_module综合配置1.Nginx状态监控1.1 Nginx status介绍1.2 Nginx status配置1.3 基本状态数据如下所示&#xff1a;&#xff08;注意本地…...

SQL经典面试题

这里写目录标题 1 背概念2 学例子 1 背概念 1 事务 事务是最小的不可在分的工作单元&#xff0c;事务的操作要么同时成功,要么同时失败。 ACID: 原子性、一致性、隔离性、持久性 2 约束 主键约束&#xff1b;外键约束&#xff08;少用&#xff0c;会增加程序的耦合性&#xff…...

Java基础知识总结(14)

map集合 /* java.util.Map接口中常用的方法 1、Map和Collection 没有继承关系 2、Map集合以key和value的方式存储数据&#xff1a;键值对key和valuea都是引用数据类型key和value都是存储对象的内存地址key起到主导地位&#xff0c;value是key的一个附属品 3、Map接口中常用的方…...

MacOS - GCC 版本升级解决方案

Mac 中自带的 GCC 版本是 4.2.1&#xff0c;由于版本太低&#xff0c;在很多操作的时候会报错。因此需要对其进行升级&#xff0c;这里使用 Homebrew 来下载最新的 GCC。 安装 Homebrew MacOS 的终端中输入如下的命令来安装 Homebrew $ /usr/bin/ruby -e "$(curl -fsSL …...

小程序绕过 sign 签名

之前看到了一篇文章 小程序绕过sign签名思路 之前在做小程序渗透时也遇到了这种情况&#xff0c;但是直接放弃测试了&#xff0c;发现这种思路后&#xff0c;又遇到了这种情况&#xff0c;记录下过程 并没有漏洞分享&#xff0c;仅仅是把小程序也分享出来&#xff0c;方便大家…...

【Canvas与艺术】绘制动态太极图

【图例】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>绘制旋转太极图</title><style type"text/css"&g…...

Llama 2 模型

非常清楚&#xff01;&#xff01;&#xff01;Llama 2详解 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/649756898?utm_campaignshareopn&utm_mediumsocial&utm_psn1754103877518098432&utm_sourcewechat_session一些补充理解&#xff1a; 序列化&#xff…...

SQLiteC/C++接口详细介绍sqlite3_stmt类(十一)

返回&#xff1a;SQLite—系列文章目录 上一篇&#xff1a;SQLiteC/C接口详细介绍sqlite3_stmt类&#xff08;十&#xff09; 下一篇&#xff1a; SQLiteC/C接口详细介绍sqlite3_stmt类&#xff08;十二&#xff09; 43、sqlite3_reset sqlite3_reset 函数用于重置已经编…...

【理解机器学习算法】之Clustering算法(Agglomerative Clustering)

聚合聚类(Agglomerative Clustering)是一种层次聚类算法&#xff0c;通过逐步合并或“聚集”它们来构建嵌套聚类。这种方法采用自底向上的方式构建聚类层次&#xff1a;它从将每个数据点作为单个聚类开始&#xff0c;然后迭代合并最接近的聚类对&#xff0c;直到所有数据点合并…...

千帆AppBuilder开发参考-应用API调用说明

介绍 百度智能云千帆AppBuilder平台提供了AppBuilder-SDK&#xff0c;开发者可使用SDK&#xff0c;快捷的开发功能&#xff0c;提升开发效率。 AppBuilder-SDK提供了完整的AI原生应用开发套件&#xff0c;包括丰富的开发组件和应用示例代码。开发组件包括大模型组件、AI能力组…...

2026年4月AI编程工具选型指南:先问自己一个问题,是搭项目还是写代码?

先问自己&#xff1a;你在哪个阶段&#xff1f;AI编程工具越来越卷&#xff0c;Cursor 3.0、Claude Code Agent Teams、Gemini Code Assist免费入场——工具多到选不过来。但选错工具的本质原因&#xff0c;往往不是工具不够好&#xff0c;而是问错了问题。选工具之前&#xff…...

Spring Boot消息队列终极指南:RabbitMQ与Kafka快速集成实战

Spring Boot消息队列终极指南&#xff1a;RabbitMQ与Kafka快速集成实战 【免费下载链接】spring-boot Spring Boot helps you to create Spring-powered, production-grade applications and services with absolute minimum fuss. 项目地址: https://gitcode.com/gh_mirrors…...

cmake之旅(2)

cmake之旅&#xff08;2&#xff09;1 从一个最小的 CMakeLists.txt 开始2 cmake_minimum_required —— 版本约束3 project —— 项目定义4 message —— 打印信息5 set —— 变量定义5.1 普通变量5.2 CMake 内置变量5.3 缓存变量6 add_executable —— 生成可执行文件7 inclu…...

为什么你的Mono.delay()在Loom下延迟翻倍?深入HotSpot虚拟线程调度器源码,定位Reactor 3.6.5+JDK21的3处隐式阻塞点

第一章&#xff1a;Java 项目 Loom 响应式编程转型指南Project Loom 为 Java 带来了轻量级虚拟线程&#xff08;Virtual Threads&#xff09;和结构化并发能力&#xff0c;与响应式编程范式&#xff08;如 Project Reactor 或 RSocket&#xff09;并非互斥&#xff0c;而是互补…...

职业倦怠解药:软件测试从业者如何保持长期动力

测试工程师的倦怠困局在敏捷开发与持续交付的浪潮中&#xff0c;软件测试工程师长期面临三重压力&#xff1a;技术迭代焦虑&#xff08;AI测试工具每月更新&#xff09;、价值隐形化&#xff08;自动化脚本掩盖人工贡献&#xff09;和责任错配&#xff08;线上事故归咎测试环节…...

CAGE vs RNA-seq:两种转录组测序技术的深度对比

在选择转录组测序方案时&#xff0c;你是否也在 CAGE 和 RNA-seq 之间犹豫&#xff1f;本文带你深入了解两种技术的核心差异与各自优势。转录组测序是功能基因组学研究的核心技术。在众多技术中&#xff0c;CAGE&#xff08;Cap Analysis of Gene Expression&#xff09;和RNA-…...

10分钟训练高质量AI音色:RVC变声器实战指南

10分钟训练高质量AI音色&#xff1a;RVC变声器实战指南 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrieval-based-Voice-Conversion-WebUI …...

如何在5分钟内掌握FlicFlac:Windows音频格式转换的轻量级解决方案

如何在5分钟内掌握FlicFlac&#xff1a;Windows音频格式转换的轻量级解决方案 【免费下载链接】FlicFlac Tiny portable audio converter for Windows (WAV FLAC MP3 OGG APE M4A AAC) 项目地址: https://gitcode.com/gh_mirrors/fl/FlicFlac FlicFlac是一款专为Window…...

10分钟释放100GB空间:AntiDupl重复图片清理终极指南

10分钟释放100GB空间&#xff1a;AntiDupl重复图片清理终极指南 【免费下载链接】AntiDupl A program to search similar and defect pictures on the disk 项目地址: https://gitcode.com/gh_mirrors/an/AntiDupl 你是否曾经因为硬盘空间不足而烦恼&#xff1f;是否在整…...

Pixel Aurora Engine保姆级教程:v1.0.0版本LoRA动态加载全流程详解

Pixel Aurora Engine保姆级教程&#xff1a;v1.0.0版本LoRA动态加载全流程详解 1. 认识你的像素游戏机 Pixel Aurora Engine&#xff08;像素极光引擎&#xff09;就像一台来自未来的复古游戏机&#xff0c;它能把你天马行空的想法变成精美的像素艺术画作。最新1.0.0版本最大…...