当前位置：首页 > article >正文

本地AI大模型部署革命：Ollama部署和API调试教程

article 2026/2/18 21:15:46

Ollama：你的私人AI助手

还在为云端AI服务的高昂费用和隐私问题而烦恼吗？Ollama横空出世，它是一款专为本地环境打造的大模型部署神器，让你轻松在自己的设备上运行各种强大的AI模型。无论你是开发者还是普通用户，Ollama都能让你以简单直观的方式与AI互动，享受本地化带来的速度与隐私保障。

全平台覆盖，无缝体验

Ollama的魅力之一就是它的全平台兼容性：

macOS：适用于所有现代版本的macOS。
Windows：支持Windows 10及更高版本。
Linux：支持多种Linux发行版，如Ubuntu、Fedora等。
Docker：通过Docker容器，Ollama可以在几乎任何支持Docker的环境中运行。

这种跨平台的灵活性意味着无论你使用什么设备，都能轻松加入本地AI的世界。

三步安装，即刻启动

安装Ollama简直就是小菜一碟：

访问官网下载：打开浏览器直奔Ollama官网
选择系统版本：根据你的操作系统选择合适的安装包
一键安装：按照提示完成安装，几分钟内就能体验AI的魅力

安装完成后，只需在命令行输入 ollama ，就能验证一切是否就绪。就这么简单！

快速上手，AI触手可及

想立即体验AI的强大？跟着这些步骤走：

启动服务：命令行输入 ollama 启动服务
部署模型：执行 ollama run gemma:2b 命令，系统会自动下载并安装Gemma模型
开始对话：模型加载完成后，你就可以开始与AI进行对话了
探索更多：随着熟悉度提升，你可以尝试更多高级功能和定制选项

即使你是AI领域的新手，这些简单步骤也能让你迅速掌握Ollama的基本操作，开启你的本地AI之旅。

Ollama的安装与配置

Windows & Mac

对于Windows和Mac用户，安装过程简直不能再简单：

Mac用户：访问 https://ollama.com/download/Ollama-darwin.zip 下载安装包
Windows用户：前往 https://ollama.com/download/OllamaSetup.exe获取安装程序

下载后双击安装，几分钟内就能完成全部设置。

Linux：服务器部署的最佳选择

对于追求性能的用户，Linux服务器是运行大模型的理想选择。以下是详细的部署步骤：

step 1: 一键安装

终端执行这行命令，一切搞定：

curl -fsSL https://ollama.com/install.sh | sh

安装成功后，系统会显示配置文件位置：

Created symlink /etc/systemd/system/default.target.wants/ollama.service → /etc/systemd/system/ollama.service.

接下来，我们采用如下命令查看下服务状态， running 就没问题了：

systemctl status ollama

查看是否安装成功，出现版本号说明安装成功：

ollama -v

step 2: 服务启动

服务启动与验证

浏览器访问http://your_ip:11434/，看到"Ollama is running"就说明一切正常！

step 3:个性化配置（可选）

想要更高级的设置？编辑配置文件：/etc/systemd/system/ollama.service

开启远程访问：

[Service] 
Environment="OLLAMA_HOST=0.0.0.0"

自定义模型存储位置：

[Service] 
Environment="OLLAMA_MODELS=/data/ollama/models"

指定GPU使用：

Environment="CUDA_VISIBLE_DEVICES=0,1"

修改配置后，别忘了重启服务：

systemctl daemon-reload 
systemctl restart ollama

Ollama实战指南

常用命令一览

Ollama的命令体系与Docker类似，简洁而强大。输入 ollama 可查看所有可用命令，包括模型管理、运行控制等核心功能。

模型库：AI的百宝箱

Ollama的模型库（ https://ollama.com/library ）堪比AI界的Docker Hub，提供了丰富多样的大模型选择：

明星模型参数规模存储大小一键部署命令 DeepSeek-R1

Model	Parameters	Size	Download
DeepSeek-R1	7B	4.7GB	ollama run deepseek-r1
DeepSeek-R1	671B	404GB	ollama run deepseek-r1:671b
Llama 3.3	70B	43GB	ollama run llama3.3
Llama 3.2	3B	2.0GB	ollama run llama3.2
Llama 3.2	1B	1.3GB	ollama run llama3.2:1b
Llama 3.2 Vision	11B	7.9GB	ollama run llama3.2-vision
Llama 3.2 Vision	90B	55GB	ollama run llama3.2-vision:90b
Llama 3.1	8B	4.7GB	ollama run llama3.1
Llama 3.1	405B	231GB	ollama run llama3.1:405b
Phi 4	14B	9.1GB	ollama run phi4
Phi 4 Mini	3.8B	2.5GB	ollama run phi4-mini
Gemma 2	2B	1.6GB	ollama run gemma2:2b
Gemma 2	9B	5.5GB	ollama run gemma2
Gemma 2	27B	16GB	ollama run gemma2:27b
Mistral	7B	4.1GB	ollama run mistral
Moondream 2	1.4B	829MB	ollama run moondream
Neural Chat	7B	4.1GB	ollama run neural-chat
Starling	7B	4.1GB	ollama run starling-lm
Code Llama	7B	3.8GB	ollama run codellama
Llama 2 Uncensored	7B	3.8GB	ollama run llama2-uncensored
LLaVA	7B	4.5GB	ollama run llava
Granite-3.2	8B	4.9GB	ollama run granite3.2

从轻量级的1B模型到庞大的671B巨兽，从通用对话到专业编程，总有一款适合你的需求。

模型安装与对话

以Llama3.2为例，安装模型只需一行命令：

ollama run Llama3.2

当看到"Send a message"提示时，你就可以开始与AI对话了！对话结束后，按 control+d 退出，下次使用同样的命令即可重新开始。

API调试：解锁无限可能

Ollama最强大的特性之一是它为每个模型自动提供了API接口，让你能将AI能力无缝集成到自己的应用中。

使用 Apifox 调试API

1. 复制以下cURL命令：

curl --location --request POST 'http://localhost:11434/api/generate' \
--header 'Content-Type: application/json' \
--data-raw '{"model": "llama3.2","prompt": "Why is the sky blue?","stream": false}'

2. 在Apifox中新建HTTP项目，创建接口并粘贴上述cURL

3. 点击"发送"，即可收到AI的回复

4. 想要体验流式输出？将 "stream": false 改为 "stream": true 即可

通过API接口，你可以将Ollama的AI能力集成到网站、应用程序、自动化工作流等各种场景中，创造无限可能。

未来展望：本地AI的无限潜力

随着大模型技术的快速发展和硬件性能的不断提升，本地部署AI将成为越来越多开发者和企业的首选。Ollama作为这一领域的先行者，不仅简化了部署流程，还为AI应用的普及铺平了道路。

在不久的将来，我们可以期待更多轻量级但功能强大的模型出现，让普通消费级设备也能流畅运行复杂AI任务。同时，本地部署也将解决数据隐私、网络延迟等云端AI的痛点，为特定行业应用提供更安全可靠的解决方案。

你是否已经迫不及待想尝试Ollama了？欢迎在评论区分享你的使用体验，或者有任何问题也可以留言讨论。如果这篇文章对你有帮助，别忘了转发给可能需要的朋友，让更多人了解本地AI部署的魅力！

本地AI大模型部署革命：Ollama部署和API调试教程

Ollama：你的私人AI助手还在为云端AI服务的高昂费用和隐私问题而烦恼吗？Ollama横空出世，它是一款专为本地环境打造的大模型部署神器，让你轻松在自己的设备上运行各种强大的AI模型。无论你是开发者还是普通用户，Ollama…...

编程日记 2026/2/18 21:15:46

centos7 linux VMware虚拟机新添加的网卡，能看到网卡名称，但是看不到网卡的配置文件

问题现象：VMware虚拟机新添加的网卡，能看到网卡，但是看不到网卡的配置文件解决方案： nmcli connection show nmcli connection add con-name ens36 ifname ens36 type ethernet #创建一个网卡连接配置文件，这里con…...

编程日记 2026/2/18 0:21:49

SRT协议

SRT（Secure Reliable Transport）是一种开源的视频传输协议，专为高丢包、高延迟网络环境设计，结合了UDP的低延迟和TCP的可靠性，广泛应用于直播、远程制作、视频会议等场景。定位：SRT协议的官方C/C实现库&am…...

编程日记 2026/2/17 12:47:52

k8s部署jenkins 创建nfs共享目录， mkdir -p /data/v2 echo /data/v2 *(rw,no_root_squash) > /etc/exports exportfs -arv创建pv、pvc vi pv.yaml apiVersion: v1 kind: PersistentVolume metadata:name: jenkins-k8s-pv spec:capacity:storage: 1GiaccessMod…...

编程日记 2026/2/17 22:49:36

在 Mermaid 流程图里“驯服”quot；的魔法指南！！！

🐉 在 Mermaid 流程图里“驯服”"的魔法指南在使用 Mermaid 画流程图时，是不是经常遇到想秀一波 " 却被它“反杀”的情况？🎯 今天就来教大家如何在这头代码野兽的嘴里，抢回我们的双引号实体编码&#…...

编程日记 2026/2/16 14:51:27

GitHub美化个人主页3D图表显示配置操作

这个功能主要是用的这个开源仓库：https://github.com/yoshi389111/github-profile-3d-contrib 想看效果的话，我的个人主页：https://github.com/Sjj1024 开始操作 1.创建自己的github主页属性项目——跟你github用户名一致即可，…...

编程日记 2026/2/17 0:07:25

欧几里得距离（Euclidean Distance）公式

欧几里得距离公式欧几里得距离（Euclidean Distance）是计算两点之间直线距离的一种方法。它是最常见的距离度量方式之一，广泛应用于数学、物理、机器学习、计算机视觉等领域。公式定义 1. 二维空间在二维平面上，假设有两个点…...

编程日记 2026/2/17 12:25:25

HarmonyOS NEXT 鸿蒙中关系型数据库@ohos.data.relationalStore API 9+

核心API ohos.data.relationalStore API 9 数据库数据库是存储和管理数据的系统数据库（Database）是一个以特定方式组织、存储和管理数据的集合，通常用于支持各种应用程序和系统的运行。它不仅是存放数据的仓库，还通过一定的…...

编程日记 2026/2/18 23:43:35

【JavaScript】JavaScript Promises实践指南

【JavaScript】JavaScript Promises实践指南你了解JavaScript中的Promises吗？这是一个很多人一开始就放弃的主题，但我会尽量让它变得尽可能简单。 1. “Promise”到底是什么？ “Promise”是异步编程中的一个基本概念，特别是在J…...

编程日记 2026/2/18 4:08:47

【软件工程】习题及答案

目录第一章习题第一章习题答案第二章习题第二章习题答案第三章习题第三章习题答案第四章习题第四章习题答案第五章习题第五章习题答案第六章习题第六章习题答案第七章习题第七章习题答案第一章习题一、选择题 1．关于引起软件危机的原因&#xff…...

编程日记 2026/1/11 17:27:39

git push的时候出现无法访问的解决

fatal: 无法访问 https://github.com/...：gnutls_handshake() failed: Error in the pull function. push的时候没有输入自己的github账号密码，为了解决每次push都要登录github这个问题，采用ssh密钥的方式认证，可以免去每次都输入…...

编程日记 2026/2/14 11:51:04

《深度剖析Android 12 SystemUI锁屏通知布局亮屏流程：从源码到实现》

优化后文章结构： 1. 前言强调锁屏通知布局的重要性及分析目的，引出后续源码分析的必要性。 2. 核心类解析 KeyguardViewMediator：锁屏核心逻辑控制，处理亮屏/息屏事件分发。 PhoneWindowManager：系统输入事件&…...

编程日记 2025/5/18 9:35:08

为什么大模型在 OCR 任务上表现不佳？

编者按： 你是否曾经用最先进的大语言模型处理企业文档，却发现它把财务报表中的“$1,234.56”读成了“123456”？或者在处理医疗记录时，将“0.5mg”误读为“5mg”？对于依赖数据准确性的运营和采购团队来说，这…...

编程日记 2026/2/17 16:06:07

HCIP(VLAN综合实验)

实验拓补图实验分析一、实验目的掌握VLAN的创建和配置方法理解VLAN在局域网中的作用学习如何通过VLAN实现网络隔离和通信二、实验环境交换机（SW1、SW2、SW3）个人电脑（PC1、PC2、PC3、PC4、PC5、PC6）路由器（R1…...

编程日记 2026/2/16 17:37:56

每日算法-250328

记录今天学习和解决的LeetCode算法题。 92. 反转链表 II 题目思路本题要求反转链表中从 left 到 right 位置的节点。我们可以采用头插法的思路来反转指定区间的链表。具体来说，我们首先定位到 left 位置节点的前一个节点 prev。然后，从 left 位置…...

编程日记 2026/2/13 22:30:44

从 Word 到 HTML：使用 Aspose.Words 轻松实现 Word 文档的高保真转换

从 Word 到 HTML：使用 Aspose.Words 轻松实现 Word 文档的高保真转换前言一、环境准备二、核心代码实现1. 将 Word 转换为 HTML 文件流2. 优化超链接样式三、测试效果四、总结前言在日常开发中，我们经常需要将 Word 文档转换为 HTML，用于…...

编程日记 2026/2/16 20:56:54

Android 设备实现 adb connect 连接的步骤

1. 检查设备的开发者选项确保平板设备已开启开发者模式，并启用了USB调试。 2. 检查设备和电脑的网络连接确保平板和电脑连接到同一个Wi-Fi网络，确认设备的 IP 地址是否正确。通过 ping 命令测试： ping 192.168.3.243. 通过USB线进行初…...

编程日记 2026/2/19 0:20:27

【人工智能】解锁大模型潜力：Ollama 与 DeepSeek 的分布式推理与集群部署实践

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界随着大语言模型（LLM）的快速发展，其推理能力在自然语言处理、代码生成等领域展现出巨大潜力。然而，单机部署难以满足高并发、低延迟的需…...

编程日记 2026/2/13 14:58:07

离散的数据及参数适合用什么算法做模型

离散数据和参数适用的机器学习算法取决于具体任务（分类、回归、聚类等）、数据特点（稀疏性、类别数量等）以及业务需求。以下是针对离散数据的常用算法分类和选择建议： 1. 分类任务（离散目标变量）经典算法决策树（ID3/C4.5/CART）直接处理离散特征，无需编码，可解释性…...

编程日记 2026/2/16 9:17:37

VMware 安装 Ubuntu 实战分享

VMware 安装 Ubuntu 实战分享 VMware 是一款强大的虚拟机软件，广泛用于多操作系统环境的搭建。本文将详细介绍如何在 VMware 中安装 Ubuntu，并分享安装过程中的常见问题及解决方法。 1. 安装前的准备工作 (1) 系统要求主机操作系统：Windo…...

编程日记 2026/2/16 14:21:09

RSA 简介及 C# 和 js 实现【加密知多少系列_4】

〇、简介谈及 RSA 加密算法，我们就需要先了解下这两个专业名词，对称加密和非对称加密。对称加密：在同一密钥的加持下，发送方将未加密的原文，通过算法加密成密文；相对的接收方通过算法将密文解密出来原文…...

编程日记 2026/2/12 20:01:29

在IDEA中快速注释所有console.log

在IDEA中快速注释所有console.log 在前端IDEA中，快速注释所有console.log语句可以通过以下步骤实现2： 打开要修改的文件。使用快捷键CtrlF打开搜索框。点击打开使用正则搜索的开关或者通过AltR快捷键来打开。在搜索框输入[]*console.log[]*，…...

编程日记 2026/2/12 19:48:35

GPT-4o图像生成功能：技术突破与隐忧并存

2025年3月25日，OpenAI正式推出GPT-4o原生图像生成功能，宣称其实现了“文本到图像的终极跨越”。然而，这一被市场追捧的技术在短短72小时内便因用户需求过载触发限流，暴露出算力瓶颈与商业化矛盾的尖锐性。这场技术狂欢的背后&…...

编程日记 2026/2/17 18:23:24

SQL语言分类及命令详解（二）

目录一、DQL (Data Query Language) 数据查询语言核心命令：SELECT 基本语法： 详细分析： 高级特性： 示例： 二、DDL (Data Definition Language) 数据定义语言核心命令 CREATE ALTER DROP TRUNCATE 详细…...

编程日记 2026/2/16 21:59:30

机器学习——LightGBM

LightGBM(light gradient boosting machine，轻量梯度提升机)是对XGBoost进行改进的模型版本，其三者之间的演变关系为：GBDT-》XGBoost-》LightGBM，依次对性能进行优化，尽管XGBoost已经很高效了，但是仍然有缺…...

编程日记 2026/2/14 14:17:18

linux 常见命令使用介绍

Linux 常见命令使用介绍 Linux 是一个功能强大的操作系统，其核心是命令行工具。掌握一些常用的 Linux 命令可以极大地提高工作效率。本文将详细介绍一些常见的 Linux 命令及其用法。 1. 文件与目录操作 ls - 列出文件和目录 # 查看当前目录下的所有文件和子目录&…...

编程日记 2026/2/15 12:33:28

故障识别 | 基于改进螂优化算法（MSADBO）优化变分模态提取（VME）结合稀疏最大谐波噪声比解卷积（SMHD）进行故障诊断识别，matlab代码

基于改进螂优化算法（MSADBO）优化变分模态提取（VME）结合稀疏最大谐波噪声比解卷积（SMHD）进行故障诊断识别一、引言 1.1 机械故障诊断的背景和意义在工业生产的宏大画卷中，机械设备的稳定运行…...

编程日记 2026/2/15 13:31:06

[已解决]服务器CPU突然飙高98%----Java程序OOM问题（2024.9.5）

目录问题描述问题排查问题解决参考资料问题描述业主单位服务器自8月29日晚上21:00起CPU突然飙高至98%，内存爆满，一直到9月5日： 问题排查 ①执行 top 命令查看Java进程PID top②执行top -Hp PID 命令查看具体的线程情况 top -Hp 3058输入上…...

编程日记 2026/2/16 1:23:59

spring如何用三级缓存解决循环依赖问题

spring为何会出现循环依赖问题？ 我们举个会产生循环依赖的例子，如下所示，可以看到AService类中依赖了BService类，同理呢，BService类中依赖了AService类，这就是所谓的循环依赖。 Component("aService&…...

编程日记 2026/2/15 13:26:34

【C#】`Task.Factory.StartNew` 和 `Task.Run` 区别

Task.Factory.StartNew 和 Task.Run 都是用来启动新任务的，但它们有一些关键区别，我们来一条一条讲清楚（配例子结论）。 🆚 1. 语法和使用目的对比项Task.RunTask.Factory.StartNew用途简化写法，用于启动…...

编程日记 2026/2/14 18:58:49