大模型管理工具:Ollama
目录
一、Ollama 介绍
二、Linux 安装 Ollama
2.1 一键安装
2.2 手动安装
三、使用Ollama
3.1 配置模型下载路径
3.2 运行模型
3.3 常用命令
四、模型管理
4.1 官方模型库
4.2 导入自定义模型
五、REST API
六、Web UI
一、Ollama 介绍
Ollama 是一个基于 Go 语言开发的可以本地运行大模型的开源框架,同时提供 REST API 管理和使用大模型。
二、Linux 安装 Ollama
2.1 一键安装
#安装
curl -fsSL https://ollama.com/install.sh | sh
#更新:再次执行安装脚本即可更新
curl -fsSL https://ollama.com/install.sh | sh
2.2 手动安装
1.下载Ollama二进制文件
curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
2.修改文件权限
chmod +x /usr/bin/ollama
3.创建ollama用户
sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama
4.创建系统服务文件
vi /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3[Install]
WantedBy=default.target
5.启用服务
systemctl daemon-reload
systemctl enable ollama
6.启动Ollama
systemctl start ollama
7.更新Ollama
#重新下载二进制文件即可
curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
chmod +x /usr/bin/ollama
8.删除Ollama
具体操作查看官方文档。
三、使用Ollama
3.1 配置模型下载路径
export OLLAMA_MODELS=/data/weisx/ollama
3.2 运行模型
#第一次执行会下载模型到本地
ollama run llama3
3.3 常用命令
创建模型:
ollama create mymodel -f ./Modelfile
删除模型:
ollama rm llama3
复制模型:
ollama cp llama3 my-model
查看模型:
ollama list
运行模型:
ollama run llama3
四、模型管理
4.1 官方模型库
可访问官网查看模型列表,以下是一些常用模型示例:
| Model | Parameters | Size | Download |
|---|---|---|---|
| Llama 3 | 8B | 4.7GB | ollama run llama3 |
| Llama 3 | 70B | 40GB | ollama run llama3:70b |
4.2 导入自定义模型
途径1:从GGUF导入
1.下载GGUF文件
#Huggingface网站下载模型的GGUF
https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit
2、创建Modelfile文件
vi Modelfile
#使用FROM指令导入本地模型
FROM ./Llama3-8B-Chinese-Chat-GGUF-8bit.gguf
#Modelfile文件中还可以添加系统提示词以及各项参数
3. 创建模型
ollama create example -f Modelfile
4.运行模型
ollama run example
途径2:从PyTorch或Safetensors导入
具体操作请参阅关于导入模型的指南。
五、REST API
https://github.com/ollama/ollama/blob/main/docs/api.md
六、Web UI
https://github.com/open-webui/open-webui
相关文章:
大模型管理工具:Ollama
目录 一、Ollama 介绍 二、Linux 安装 Ollama 2.1 一键安装 2.2 手动安装 三、使用Ollama 3.1 配置模型下载路径 3.2 运行模型 3.3 常用命令 四、模型管理 4.1 官方模型库 4.2 导入自定义模型 五、REST API 六、Web UI 一、Ollama 介绍 Ollama 是一个基于 Go 语言…...
recycleView的item,TV正确方式获取焦点,以及刷新界面
如果你正需要recycleView的焦点 GlobalScope.launch (Dispatchers.Main){ // layout.isVisible truesettingBinding.rootLayout.isVisible truesettingBinding.rvSettingTab.layoutManager?.scrollToPosition(itemPositionSelect)if(!GlobalVariable.isT…...
QT内存管理机制
1.父子关系管理:Qt 对象之间可以建立父子关系。当一个对象是另一个对象的子对象时,父对象负责管理子对象的生命周期。当父对象被销毁时,它所拥有的子对象也会被销毁,从而释放相关的内存。这种机制简化了内存管理,确保在…...
亚马逊卖家,如何打造爆款,如何提高产品权重、曝光、流量?
新老卖家们要知道,亚马逊A9算法影响产品排名的关键因素:产品相关性、销售排名、产品价格、点击率、转化率、产品图片、买家评论、买家满意度、QA的答复情况、搜索结果页详细信息级别。亚马逊A9算法,是根据卖家提供的listing文案信息进行收录、…...
处理HTTP请求的服务器
处理HTTP请求的服务器,通常被称为HTTP服务器或Web服务器。其主要功能包括接收、解析、处理和响应HTTP请求。 HTTP服务器处理HTTP请求的基本流程: 接收请求:服务器监听特定的网络端口,等待客户端(如Web浏览器…...
打造本地GPT专业领域知识库AnythingLLM+Ollama
如果你觉得openai的gpt没有隐私,或者需要离线使用gpt,还是打造专业领域知识,可以借用AnythingLLMOllama轻松实现本地GPT. AnythingLLMOllama 实现本地GPT步聚: 1 下载 AnythingLLM软件 AnythingLLM官网地址: Anythi…...
数据可视化训练第6天(美国人口调查获得关于收入与教育背景的数据,并且可视化)
数据来源 https://archive.ics.uci.edu/dataset/2/adult 过程 首先;关于教育背景的部分翻译有问题。 本次使用字典嵌套记录数据,并且通过lambda在sorted内部进行对某个字典的排序,最后用plotly进行绘图 本次提取数据的时候,用到…...
如何更换远程服务器的Python版本
目录 前言 正文 尾声 🔭 Hi,I’m Pleasure1234🌱 I’m currently learning Vue.js,SpringBoot,Computer Security and so on.👯 I’m studying in University of Nottingham Ningbo China📫 You can reach me by url below:My Blo…...
Python 运筹优化13 Thompson Sampling 解读
说明 这部分应该是Multi-Armed Bandit的最后一部分了。 内容 1 On Line Ads 这个实验,最初的目的就是为了选出最佳的广告。首先,通过伯努利分布,模拟了某个广告的有效率。在真实场景里,我们是无法知道那个广告更好的。可能在t…...
计算机毕业设计 | SpringBoot健身房管理系统(附源码)
1,项目背景 随着人们生活水平的提高和健康意识的增强,健身行业逐渐兴起并迅速发展。而现代化的健身房管理系统已经成为健身房发展的必备工具之一。传统的健身房管理方式已经无法满足现代化健身房的需求,需要一种更加高效、智能、安全的管理系…...
大模型LLM 结合联网搜索增强isou
参考: https://github.com/yokingma/search_with_ai 在线使用网址: https://isou.chat/ 安装github下载,运行docker compose 如果一直报下面错误: 解决方法https://github.com/yokingma/search_with_ai/pull/7 默认打开&a…...
软删除和硬删除的区别及实际应用
在处理数据存储时,删除操作是不可避免的一部分。然而,并非所有的删除都是相同的。在本篇博客中,我们将探讨软删除(Soft Delete)和硬删除(Hard Delete)的概念、它们之间的区别,以及如…...
算法加密-简介
前言 在遥远的古代,信息的传递至关重要。战争时期,将领们需要确保自己的作战计划不被敌人知晓。 有一次,一位聪明的将军想要给远方的盟友传递一份机密战略部署。他想到了一个办法,用一种特殊的符号来替代文字。他和盟友事先约定好…...
搞懂Docker(九)- 使用Docker Compose
获取示例程序 示例程序 或者 示例程序 获取示例程序程序结构如下├── getting-started-app/ │ ├── package.json │ ├── README.md │ ├── spec/ │ ├── src/ │ └── yarn.lock使用Docker Compose Docker Compose是一个帮助你定义和共享多容器应用程序的工具…...
EOCRSP-40NM7施耐德电机保护器EOCR-SP
韩国三和EOCRSP-40NM7 40A AC220V电动机保护器 密集型设计 ■ 电子式多保护功能 ■ 宽的电流调整范围(10:1) ■ 电流表功能 ■ LED跳闸指示 ■ 高精度 ■ 手动即时复位 ■ 电动远距离复位 ■ 自检功能 ■ 强的环境适应性 ■ 低能耗 ■ 失效-安全工作方式(无电压释放) 韩国三和…...
一文带你快速了解GPT-4o!内含免费使用指南!
一、GPT-4o简介 北京时间5月14日,OpenAI举行春季发布会。OpenAI在活动中发布了新旗舰模型“GPT-4o”!据OpenAI首席技术官穆里穆拉蒂(Muri Murati)介绍,GPT-4o在继承GPT-4强大智能的同时,进一步提升了文本、…...
react18【系列实用教程】useState (2024最新版)
类似 vue 的 data 选项 功能 向组件添加响应式变量,当响应式变量变化时,组件的视图UI也会跟着变化【数据驱动视图】 语法 参数为变量的初始值返回值为一个只有两个元素的数组,第一项元素为传入的参数,第二项元素是一个setter 函数…...
电商选品的数据是可以用爬虫进行采集的吗?
在电子商务领域,选品是一个至关重要的环节,它直接影响到商家的销售业绩和市场竞争力。为了做出更明智的选品决策,商家需要获取大量的市场数据和产品信息。那么,电商选品的数据是否可以通过爬虫进行采集呢? 爬虫在电商数…...
数据特征降维 | 局部线性嵌入(LLE)
局部线性嵌入(Locally Linear Embedding,LLE)是一种非线性降维和数据嵌入技术,用于将高维数据映射到低维空间中,以便更好地展示数据的结构和关系。 LLE的基本思想是假设数据样本在局部区域内可以近似由其相邻样本的线性组合表示。通过保持这种局部线性关系,LLE能够在低维…...
js发票查验、票据OCR接口助力解决发票录入与真假辨别难题
作为消费者,每位都是税法的监督员,为了保护自己的合法权益、共同维护市场秩序,消费者进行实际交易后无论是否需要报销,都应该主动向商家索取发票。一般来说发票主要有三种:增值税专用发票、普通发票、专业发票。以下&a…...
新手友好:借助快马平台的免费token轻松迈出AI应用开发第一步
作为一名刚接触AI开发的新手,我最近在InsCode(快马)平台上完成了一个文本摘要生成器的项目,整个过程非常顺畅。这个平台对初学者特别友好,尤其是提供了免费token,让我们可以零成本体验AI开发的乐趣。 理解token的概念 刚开始我对…...
保姆级教程:用Python的face_recognition库,5分钟搞定人脸检测+特征点标记
零基础玩转Python人脸识别:5分钟实现智能美颜与表情分析 记得第一次接触人脸识别技术时,我盯着手机相册里自动分类的人物相册发了半天呆——这玩意儿到底是怎么认出我换了发型还长了胡子的?作为Python初学者,你可能觉得这种"…...
设计一个简单的图书借阅管理系统。
设计一个简单的图书借阅管理系统。系统初始包含若干本图书,每本图书的信息包括: 书号(字符串) 书名(字符串) 作者(字符串) 库存数量(整数) 另外,系…...
Windows下Qt集成libcurl:从零搭建网络请求环境与实战验证
1. 为什么选择Qtlibcurl组合 在Windows平台开发带网络功能的Qt应用时,你可能纠结过该用QNetworkAccessManager还是第三方库。我做过十几个跨平台项目,实测下来libcurl有三大不可替代的优势: 首先是对HTTPS的完美支持。Qt自带的网络模块在Wi…...
新手福音:零基础在快马平台创建你的第一个口播智能体
今天想和大家分享一个特别适合编程新手的实战项目——在InsCode(快马)平台上创建一个旗博士口播智能体。这个项目不需要任何后端知识,用最基础的HTML和JavaScript就能实现,而且能让你直观感受到AI应用的开发流程。 项目整体思路 这个口播智能体的核心功能…...
QQ音乐加密文件自由播放全攻略:qmcdump工具深度应用指南
QQ音乐加密文件自由播放全攻略:qmcdump工具深度应用指南 【免费下载链接】qmcdump 一个简单的QQ音乐解码(qmcflac/qmc0/qmc3 转 flac/mp3),仅为个人学习参考用。 项目地址: https://gitcode.com/gh_mirrors/qm/qmcdump 一、…...
赛马娘DMM版汉化与优化完整指南:轻松实现完美游戏体验
赛马娘DMM版汉化与优化完整指南:轻松实现完美游戏体验 【免费下载链接】umamusume-localify Localify "ウマ娘: Pretty Derby" DMM client 项目地址: https://gitcode.com/gh_mirrors/um/umamusume-localify 还在为赛马娘DMM版的日文界面而烦恼吗&…...
OpenClaw版本升级:无缝迁移Kimi-VL-A3B-Thinking对接配置
OpenClaw版本升级:无缝迁移Kimi-VL-A3B-Thinking对接配置 1. 升级前的准备工作 上周我在升级OpenClaw时遇到了一个棘手的问题——新版本与现有的Kimi-VL-A3B-Thinking模型对接出现了兼容性问题。这让我意识到,对于依赖特定模型服务的自动化工作流来说&…...
微信数据解密技术全解析:从原理到合规应用
微信数据解密技术全解析:从原理到合规应用 【免费下载链接】PyWxDump 删库 项目地址: https://gitcode.com/GitHub_Trending/py/PyWxDump 合规使用声明 本文所介绍的技术与工具仅适用于个人合法拥有的数据管理场景。使用者必须确保:1) 仅对本人所…...
5分钟快速上手:解锁付费内容的终极指南
5分钟快速上手:解锁付费内容的终极指南 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在信息时代,优质内容常常被付费墙阻隔,但今天我要为你介绍一…...
