使用Ollama搭建一个免费的聊天机器人
0 概述
Ollama是一个能在本机运行大语言模型的软件,它提供命令行和API的交互方式,对于需要考虑数据隐私的情景,可以方便的使用Ollama部署大语言模型,并在此基础上开发RAG等应用,而无需调用OpenAI等开放API。Ollama基本上已经建立了比较完善的生态,除了在系统中使用命令行、API等方式交互,Langchain、Dify等开发框架也都支持Ollama,另外,也有非常多GUI客户端可以使用,像在iPhone、iPad等移动端设备上,也可以通过仅仅修改一个地址就能拥有属于自己的“ChatGPT”。
1 入门
1.1 下载安装
从官方网站https://ollama.com/直接下载安装即可
1.2 常用环境变量
1.2.1 OLLAMA_MODELS
模型下载目录
macOS下指定此目录,此目录中会下载文件,但在~/.ollama/models下也会下载文件
1.2.2 OLLAMA_HOST
Ollama监听网络地址,默认监听回环地址
export OLLAMA_HOST=0.0.0.0# or指定监听端口export OLLAMA_HOST=0.0.0.0:8080
1.3 模型库
从官方网站可以查找支持的模型https://ollama.com/library
1.4 其他可用模型
ollama run roger/minicpm
2 基本使用
2.1 下载模型
可以设置环境变量OLLAMA_MODELS来指定模型下载位置,此步非必须,因为大语言模型一般都比较大,如果需要指定下载路径,可以设置环境变量
注意修改下方的地址为自己电脑中的地址
export OLLAMA_MODELS=/Volumes/SHAERGE/Appdata/Ollama
下载模型
ollama pull gemma:2b
查看模型信息
ollama show --modelfile gemma:2b
# Modelfile generated by "ollama show"
# To build a new Modelfile based on this one, replace the FROM line with:
# FROM gemma:2bFROM /Users/luogang/.ollama/models/blobs/sha256-c1864a5eb19305c40519da12cc543519e48a0697ecd30e15d5ac228644957d12
TEMPLATE """<start_of_turn>user
{{ if .System }} <end_of_turn>
<start_of_turn>model
<end_of_turn>
"""
PARAMETER repeat_penalty 1
PARAMETER stop "<start_of_turn>"
PARAMETER stop "<end_of_turn>"
2.2 导出模型
记住上面的模型路径,拷贝到一个新的文件,模型格式为gguf,例如:
注意修改下方的地址为自己电脑中的地址
cp /Users/luogang/.ollama/models/blobs/sha256-c1864a5eb19305c40519da12cc543519e48a0697ecd30e15d5ac228644957d12 /Users/luogang/Downloads/gemma/gemma_2b.gguf
2.3 创建模型
创建一个Modelfile文件,最简形式如下:
From /Users/luogang/Downloads/gemma/gemma_2b.gguf
完整形式如下:

使用如下命令创建Ollama模型
可以设置环境变量OLLAMA_MODELS来指定模型下载位置
注意修改上面的地址为自己电脑中的地址
ollama create mygemma:2b -f Modelfile
然后使用
ollama run mygemma:2b
可以正常使用

2.4 运行
如果指定的模型没有下载,运行时会先下载
ollama run qwen:1.8b
使用效果如下,实际生成token的速度非常快

2.5 列出已下载模型
ollama list
2.6 启动服务
macOS下
在macOS上,点击Ollama图标运行程序后,就已经启动服务了,默认监听在11434端口
不过要注意,从点击Ollama图标的方式运行的方式,没有办法设置环境变量,虽然在https://github.com/ollama/ollama/issues/703此处有人给出了解决方案 launchctl setenv OLLAMA_HOST 0.0.0.0:8080,但经过尝试并不生效
Linux下
ollama serve
在Linux下安装成功后,会默认安装为一个服务,系统启动后相当于自动执行了ollama serve,此时可以修改systemd启动单元/etc/systemd/system/ollama.service
注意将下方Environment中的相关路径,替换为自己的路径
[Unit]
Description=Ollama ServiceA
fter=network-online.target[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=/home/luogang/.autojump/bin:/opt/anaconda3/bin:/opt/anaconda3/condabin:/home/luogang/.autojump/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin:/usr/local/cuda-11.8/bin:/usr/local/cuda-11.8/bin"
Environment="OLLAMA_HOST=0.0.0.0"[Install]
WantedBy=default.target
Environment="OLLAMA_HOST=0.0.0.0"这一行是新增的,编辑完成保存后,执行如下命令

如果启动状态检查没有报错,说明启动成功,再次使用如下命令检查环境变量是否生效
netstat -an | grep 11434
2.7 REST API
更多API可以参考此处:https://www.postman.com/postman-student-programs/workspace/ollama-api/collection/21521806-f48dc31a-a9f1-4dad-9082-fd07f5cd2fda
2.7.1 列出模型
curl http://localhost:11434/api/tags
2.7.2 查看模型信息

2.7.3 生成
stream参数非必填,默认为true,下同

2.7.4 对话

2.7.5 Embedding

3 以服务的方式关联前端GUI使用
3.1 Echanted
在Ollama启动后(双击运行或者ollama serve方式),启动Echanted不需要做任何修改,直接可以运行
3.1.1 macOS

3.1.2 iPadOS
iPadOS下支持Ollama的软件比较多,比如Enchanted、OpenCat等,Enchanted完全免费,下面以此为例。
点击左上角的按钮展开侧边栏,然后在最底下的Settings,需要在设置中的OLLAMA下输入Ollama服务地址,比如http://192.168.31.26:11434

要注意,这个地址需要iPad能够访问到,也就意味着Ollama服务启动时需要监听0.0.0.0

3.2 Open WebUI
直接使用Docker启动
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
登录后,需要注册,填写个人信息进行注册即可
进入界面后,在界面顶端可以直接选择已经下载的模型

如何学习大模型
现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。
作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。
我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。
一、AGI大模型系统学习路线
很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

二、AI大模型视频教程

三、AI大模型各大学习书籍

四、AI大模型各大场景实战案例

五、结束语
学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。
再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。
因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。
相关文章:
使用Ollama搭建一个免费的聊天机器人
0 概述 Ollama是一个能在本机运行大语言模型的软件,它提供命令行和API的交互方式,对于需要考虑数据隐私的情景,可以方便的使用Ollama部署大语言模型,并在此基础上开发RAG等应用,而无需调用OpenAI等开放API。Ollama基本…...
计算机网络之快重传和快恢复以及TCP连接与释放的握手
快重传和快恢复 快重传可以让发送方尽早得知丢失消息, 当发送消息M1,M2,M3,M4,M5后,假如消息M2丢失,那么按照算法会发送对M2报文前一个报文M1的重复确认(M1正常接受到,已经发送了确认),然后之后收到M4,M5,也会发送两…...
vue 引用第三方库 Swpier轮播图
本文全程干货,没有废话 1.使用 npm 安装 swiper,使用 save 保存到 packjson 中 npm install --save swiper 2、把 swiper看成是第三方库或者是组件,然后按照,引用,挂载组件,使用组件三步法。 3、在 script…...
RabbitMQ-直连交换机(direct)使用方法
RabbitMQ-默认读、写方式介绍 RabbitMQ-发布/订阅模式 目录 1、概述 2、直连交换机 3、多重绑定 4、具体代码实现 4.1 生产者部分 4.2 消费者部分 5、运行代码 6、总结 1、概述 直连交换机,可以实现类似路由的功能,消息从交换机发送到哪个队列…...
942. 增减字符串匹配 - 力扣
1. 题目 由范围 [0,n] 内所有整数组成的 n 1 个整数的排列序列可以表示为长度为 n 的字符串 s ,其中: 如果 perm[i] < perm[i 1] ,那么 s[i] I 如果 perm[i] > perm[i 1] ,那么 s[i] D 给定一个字符串 s ,重构排列 pe…...
2024华为OD机试真题-机器人搬砖-C++(C卷D卷)
题目描述 机器人搬砖,一共有N堆砖存放在N个不同的仓库中,第i堆砖中有bricks[i]块砖头, 要求在8小时内搬完。机器人每小时能搬砖的数量取决于有多少能量格, 机器人一个小时中只能在一个仓库中搬砖,机器人的能量格每小时补充一次且能量格只在这一个小时有效,为使得机器人损…...
【DevOps】深入了解RabbitMQ:AMQP协议基础、消息队列工作原理和应用场景
目录 一、核心功能 二、优势 三、核心概念 四、工作原理 五、交换机类型 六、消息确认 七、持久性和可靠性 八、插件和扩展 九、集群和镜像队列 十、客户端库 十一、管理界面 十二、应用场景 RabbitMQ是一个基于AMQP协议的消息队列中间件,提供高可用、可…...
Mysql 技术实战篇
命令行 导出 - -h localhost:指定MySQL服务器的主机地址为本地主机。如果MySQL服务器在其他主机上,请将localhost替换为相应的主机地址。 - -u username:指定连接MySQL服务器的用户名。将username替换为您的有效用户名。 - -p:提…...
App自动化测试_Python+Appium使用手册
一、Appium的介绍 Appium是一款开源的自动化测试工具,支持模拟器和真机上的原生应用、混合应用、Web应用;基于Selenium二次开发,Appium支持Selenium WebDriver支持的所有语言(java、 Object-C 、 JavaScript 、p hp、 Python等&am…...
k8s-部署对象存储minio
环境信息 minio版本 :最新 k8s 版本1.22 使用nfs作为共享存储 一.单节点安装包部署 脚本部署,一键部署,单节点应用于数据量小,一些缓存存储,比如gitlab-runner的产物数据,maven的打包依赖数据 #!/bin/bash# 步骤…...
go常用命令
创建一个module(逻辑概念) #The go mod init command initializes and writes a new go.mod file in the current directory, in effect creating #a new module rooted at the current directory. #specify a module path that serves as the module’s name. go mod initclon…...
【中年危机】程序猿自救指南
中年危机,一个听起来就充满挑战的词汇,它不仅仅是一个年龄的标记,更是一个个人成长和职业发展的转折点。 构架个人品牌: 学会打造IP个人品牌是职业生涯中的重要资产。在中年时期,你已经积累了丰富的经验和知识&#x…...
vueRouter路由总结
https://blog.csdn.net/qq_24767091/article/details/119326884...
算法工程师需要学习C++的哪些知识?
在开始前刚好我有一些资料,是我根据网友给的问题精心整理了一份「C的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!!以下是算法工程师需要学习的一些…...
CTF网络安全大赛简单的web抓包题目:HEADache
题目来源于:bugku 题目难度:简单 题目 描 述: > Wanna learn about some types of headache? > Lets dig right into it! 下面是题目源代码: <!DOCTYPE html> <html> <head><meta charset"utf-8"&…...
Qt Creator创建Python界面工程并打包为可执行exe文件
Qt Creator创建Python界面工程并打包为可执行exe文件_qtcreator创建python工程-CSDN博客...
基于单片机的步进电机控制系统的研究
摘要: 步进电机控制作为一种电机控制系统的重要模式,属于现代数字化控制的重要手段,其应用已经相当广泛。步进电机属于感应电机类,利用电子电路将直流电分为分时供电、多相时序供电控制电流,利用这种电流为电机供电,驱使电机工作。步进电机不能够在常规模式下使用,必须通过双环…...
BioPorto胰高血糖素样肽-1抗体(GLP-1)
丹麦BioPorto Diadnostics公司致力于提供世界领先的GLP-1抗体。基于结合GLP-1位点的不同,他们筛选出了不同的抗GLP-1抗体。有的抗体可以同时结合GLP-1的活性形式和非活性形式,有的专门结合生物活性形式的GLP-1。在开发和检测GLP-1相关治疗的过程中&#…...
Go 语言字符串及 strings 和 strconv 包
在 Go 语言编程中,字符串是最基本、最常用的数据类型之一。无论是处理用户输入、读取文件内容,还是生成输出,字符串操作无处不在。为了方便开发者对字符串进行各种操作,Go 语言提供了强大的 strings 包和 strconv 包。strings 包包…...
政府窗口服务第三方评估报告如何写
撰写政府窗口服务第三方评估报告需要结构清晰、内容详实,并包含对评估过程和结果的详细描述以及改进建议。以下是第三方评估机构民安智库(第三方社会评估调研公司)给出的一个政府窗口服务第三方评估报告简单的示例: 一、封面 报…...
使用Typora与Qwen3.5-4B打造智能写作工作流:大纲生成与文稿润色
使用Typora与Qwen3.5-4B打造智能写作工作流:大纲生成与文稿润色 1. 写作痛点与解决方案 对于内容创作者和技术文档工程师来说,Markdown写作过程中常遇到三个核心问题:一是从零开始构思文章大纲耗时费力;二是反复检查语法和风格一…...
RK3399pro固件逆向实战:3步提取文件系统(附完整命令)
RK3399pro固件逆向实战:从原理到实践的深度拆解 在嵌入式设备安全研究领域,固件逆向分析是获取设备内部运行机制的关键入口。作为Rockchip旗下的高性能处理器,RK3399pro广泛应用于智能硬件、边缘计算设备等领域。当我们拿到一个RK3399pro设备…...
LabelImg图像标注工具:3分钟掌握高效目标检测数据标注技巧
LabelImg图像标注工具:3分钟掌握高效目标检测数据标注技巧 【免费下载链接】labelImg LabelImg is now part of the Label Studio community. The popular image annotation tool created by Tzutalin is no longer actively being developed, but you can check ou…...
前端埋点数据爆炸?WebTracing缓存策略与采样率配置避坑指南
前端埋点数据治理实战:WebTracing缓存策略与采样率配置深度解析 当你的应用日活突破百万量级时,埋点数据会像雪崩一样涌向服务器。某电商平台曾因未合理配置前端监控,导致单日产生2.3TB冗余埋点数据,不仅每年浪费数百万云存储成本…...
Ubuntu20.04下HPC_SDK加速库安装避坑指南(附OpenACC测试代码)
Ubuntu 20.04下HPC_SDK加速库深度实战指南:从安装到OpenACC性能调优 在当今高性能计算领域,GPU加速已成为提升计算效率的关键技术。NVIDIA HPC SDK作为一套全面的开发工具包,为开发者提供了从编译器到性能分析的全套解决方案。本文将带您深入…...
SDMatte新手入门:交互式点选,让复杂抠图变简单
SDMatte新手入门:交互式点选,让复杂抠图变简单 1. 什么是SDMatte? SDMatte是一款基于扩散模型的交互式图像抠图工具,由vivoCameraResearch团队开发。它通过简单的点选操作,就能实现专业级的图像抠图效果,…...
让 TDengine 在 JetBrains IDEs 里更像“原生数据库”一点
让 TDengine 在 JetBrains IDEs 里更像“原生数据库”一点 Author: ChangJin Wei (魏昌进) 最近我做了一个小插件,把 TDengine 接入到了 JetBrains IDEs 的数据库工具链里。 先埋个小提示:文末有彩蛋。 项目地址: GitHub: https://github.…...
别再让WIFI信号‘水土不服’!Android 13高通平台国家码配置保姆级教程
Android 13高通平台WIFI国家码配置实战指南 当你的设备跨越国界,WIFI信号却开始"水土不服"——连接不稳定、速度骤降甚至完全无法使用。这背后往往不是硬件问题,而是国家码配置这个隐形门槛在作祟。作为深耕Android系统开发多年的技术专家&am…...
Nunchaku-flux-1-dev技术解析:深入理解其背后的深度学习网络架构
Nunchaku-flux-1-dev技术解析:深入理解其背后的深度学习网络架构 最近在AI编程和图像生成圈子里,FLUX.1 [dev]这个名字被讨论得越来越多。作为其社区衍生版本,Nunchaku-flux-1-dev自然也吸引了大量技术爱好者的目光。大家可能已经体验过它生…...
终极Hasklig字体完全指南:如何通过编程连字技术提升代码可读性
终极Hasklig字体完全指南:如何通过编程连字技术提升代码可读性 【免费下载链接】Hasklig Hasklig - a code font with monospaced ligatures 项目地址: https://gitcode.com/gh_mirrors/ha/Hasklig Hasklig是一款专为编程设计的等宽字体,通过创新…...
