本地安装Ollama+WebUI
本地安装Ollama+WebUI
B站教程地址:https://www.bilibili.com/video/BV1Kz421h7Jk/?spm_id_from=333.337.search-card.all.click&vd_source=42b07826977d09765ec11b9fa06715e5
一、下载Ollama
https://ollama.com/download 支持mac、linux、windows
选择在ubuntu下安装
odoo@odoo-pc:~$ curl -fsSL https://ollama.com/install.sh | sh
>>> Installing ollama to /usr/local
[sudo] odoo 的密码:
>>> Downloading Linux amd64 bundle
######################################################################## 100.0%######################################################################### 100.0%
>>> Creating ollama user...
>>> Adding ollama user to render group...
>>> Adding ollama user to video group...
>>> Adding current user to ollama group...
>>> Creating ollama systemd service...
>>> Enabling and starting ollama service...
Created symlink /etc/systemd/system/default.target.wants/ollama.service → /etc/systemd/system/ollama.service.
>>> The Ollama API is now available at 127.0.0.1:11434.
>>> Install complete. Run "ollama" from the command line.
WARNING: No NVIDIA/AMD GPU detected. Ollama will run in CPU-only mode.从上面的安装过程发现两点:
1、api的端口号是11434
2、没有检测到显卡,Ollama运行在cpu模式下
安装第一个大模型: 其实这一步可用不用做,后面通过webui来安装。
odoo@odoo-pc:~$ ollama run llama3
pulling manifest
pulling 6a0746a1ec1a... 100% ▕████████████████▏ 4.7 GB
pulling 4fa551d4f938... 100% ▕████████████████▏ 12 KB
pulling 8ab4849b038c... 100% ▕████████████████▏ 254 B
pulling 577073ffcc6c... 100% ▕████████████████▏ 110 B
pulling 3f8eb4da87fa... 100% ▕████████████████▏ 485 B
verifying sha256 digest
writing manifest
success
>>> Send a message (/? for help)
到这里就可以向大模型提问了,进行交互了,不过只能在本地终端进行,下面,我们需要安装WebUI,可用通过web界面进行交互。
二、安装WebUI
https://docs.openwebui.com
因为我的机器没有GPU,所以找了一个不需要GPU命令进行安装:
For CPU Only: If you're not using a GPU, use this command instead:
docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
odoo@odoo-pc:~$ sudo docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
[sudo] odoo 的密码:
Unable to find image 'ghcr.io/open-webui/open-webui:ollama' locally
ollama: Pulling from open-webui/open-webui
a2318d6c47ec: Pull complete
334af29dc78e: Pull complete
d534b3df1e9e: Pull complete
95b5b248c442: Pull complete
98d167576f7c: Pull complete
ac786ed3fe21: Pull complete
4f4fb700ef54: Pull complete
0b3cbd1796a0: Pull complete
08dcfffb691a: Pull complete
290e855a01d4: Pull complete
da884a0397a7: Pull complete
46fe1a8da679: Pull complete
6497c5d13491: Pull complete
2e2171744e6b: Pull complete
8558874c3ff3: Pull complete
15f64213e6de: Pull complete
Digest: sha256:b70396e243682d7e93fc426b5aa6ade41c2240e5559aa00301dbdcf8e520235b
Status: Downloaded newer image for ghcr.io/open-webui/open-webui:ollama
ba2b5958578f44030936768b324f451ecce00865047fc53e158ce84c616e91e1
安装完成后打开地址
http://127.0.0.1:3000/
注册一个账号,账号会保存在本地而不是云端,第一个注册的账号会成为管理员。
进入界面后,选择左下角的头像进入设置菜单,通用里面可用选择语言,默认会跟操作系统的语言保持一致。
选择管理员设置:
会出现模型的设置。
注意: Ollama是一个管理平台,它可用管理很多模型,像开源的llama3, chatgpt等
从ollama.com选取一个模型,然后输入模型的名称,就可以进行下载。下载速度还是比较快的。
可用多安装几个模型,获取更多元化的回答。
注册了一个账号:
fatux 156277468@qq.com 密码是最复杂的
三、使用技巧
1、模型
可用安装别人训练好的agent
2、提示词
3、指定检索文件
在让大模型回答问题之前可用指定文件,不过这样有个缺点,大模型需要经过检索和回答两个步骤,可能需要的时间会变长。
四、微调模型
让AI将特定领域的知识,内化整合成模型的一部分,而这种让语言模型在原有知识的基础上进行额外训练的过程被称为模型微调。fine-tuning
要微调模型,我们要准备一些问答的范例协助AI进行学习,其中一种常见的格式叫Json
格式类似于QA,有问有答
可用通过chatgpt转换成JSON格式的文本。
https://unsloth.ai/ 训练和微调语言模型的工具
相关文章:
本地安装Ollama+WebUI
本地安装OllamaWebUI B站教程地址:https://www.bilibili.com/video/BV1Kz421h7Jk/?spm_id_from333.337.search-card.all.click&vd_source42b07826977d09765ec11b9fa06715e5 一、下载Ollama https://ollama.com/download 支持mac、linux、windows 选择在ubu…...
请求响应-05.请求-日期参数JSON参数
一.日期参数 当浏览器发起的请求参数类型是日期参数时,我们通常使用LocalDateTime对象来接收,前面使用DateTimeFormat注解来完成日期的格式转换(日期时间格式有多种,需要哪种就设置为哪种:如yyyy-MM-dd HH:mm:ss&…...
CSS学习路线
CSS学习路线大全及面试常见题目可以归纳为以下几个部分: CSS学习路线大全 CSS基础 引入CSS的方式:外部样式表、内部样式表、内联样式。CSS选择器:包括ID选择器、类选择器、标签选择器、后代选择器、子选择器、相邻兄弟选择器、兄弟选择器、…...
Linux memcg lru lock提升锁性能
目录 内核关于per memcg lru lock的重要提交: 计算虚拟地址转换基本机制 问题背景 swap换入流程 时奎亮的per memcg lru lock分享视频 内核关于per memcg lru lock的重要提交: f9b1038ebccad354256cf84749cbc321b5347497 6168d0da2b479ce25a4647d…...
【spring】引入 Jackson 依赖 对java对象序列号和反序列化
Jackson Jackson 是一个非常流行的 Java 序列化/反序列化库,用于将 JSON 转换为 Java 对象,或者将 Java 对象转换为 JSON。要在你的 pom.xml 文件中引入 Jackson 依赖,你可以按照下面的步骤进行操作。引入 Jackson 依赖 通常,Jackson 核心库包含以下三个部分: jackson-dat…...
算法面经手撕系列(3)--手撕LayerNormlization
LayerNormlization 在许多的语言模型如Bert里,虽然都是说做的LayerNormlization,但计算均值和方差只会沿着channel维度做,并不是沿着seq_L和channel维度一起做,参考:BERT用的LayerNorm可能不是你认为的那个Layer Norm LayerNorm…...
出厂非澎湃OS手机解BL锁
脚本作者:酷安mlgmxyysd 脚本项目链接:https://github.com/MlgmXyysd/Xiaomi-HyperOS-BootLoader-Bypass/ 参考 B站作者:蓝空穹 https://www.bilibili.com/read/cv33210124/ 其他参考:云墨清风、水墨青竹、Magisk中文网 决定解BL…...
Go语言错误处理之道:优雅地应对程序中的问题
错误处理是任何编程语言中的关键部分,Go语言以其独特的错误处理机制而著称。对于初学者来说,理解Go语言中的错误处理对于编写健壮和可靠的程序至关重要。 为什么需要错误处理 在编程中,错误处理是必不可少的,因为程序可能会遇到…...
LIMS实验室管理系统的特点
LIMS实验室管理系统在实验室管理中发挥着不可或缺的作用。首要特点是其强大的自动化数据管理功能,该系统能够无缝集成实验室从样品接收到测试结果录入与存储的全过程,显著提升了数据的准确性和可靠性,减少了人为错误的可能性。 流程优化是LI…...
vue之 package.json和package-lock.json
一、package.json 定义了当前项目所需要引用的各个模块,可以手工修改配置,也可以删除后,使用npm init命令重新自动生成。 但是该文件只锁定大版本号,也就是版本号的第一位,所以你会发现两个文件中同一个包的版本号不一…...
android 老项目中用到的jar包不存在,通过离线的方法加载
1、之前的项目用的jar包,已经不在远程仓库中,只能手工去下载,并且安装。 // implementation com.github.nostra13:Android-Universal-Image-Loader // implementation com.github.lecho:hellocharts-android:v1.5.8 这…...
每天五分钟玩转深度学习框架PyTorch:梯度下降之学习率衰减
本文重点 我们前面学习了优化器optim,然后学习了为神经网络不同层设置不同的学习率,本节课程我们讲解学习率衰减的方法,也就是说如何在训练过程中动态的修改学习率,本文介绍两种方法。本文是学习第6步(优化器) 为什么要进行学习率衰减 对于一阶梯度进行优化的方法而言,…...
智能家居配上高颜值UI,瞬间感觉消费不起了呢
高颜值的UI设计可以给智能家居产品带来奢华和高端的感觉,为大家分享一波搞颜值界面。 高颜值的智能家居界面设计可以带来以下优势和好处: 用户体验提升: 高颜值的界面设计可以提升用户的视觉享受和满意度。精美的界面设计可以给用户带来愉…...
Winform登录实现及工具栏切换
1、登录实现 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows.Forms;namespace LoginApp {public par…...
Git bash使用
将本地文件推送到github上 先在所在文件夹进行初始化 git init绑定你的远程仓库 git remote add origin URL 随即 git add 指定文件 ——将工作区域中的文件添加到缓冲区 git commit -m【提交附带的信息】 git push origin master 推送到远程仓库 推送的时候可能会出现一些情…...
Java入门程序-HelloWorld
Java程序开发的三个步骤 1.编写代码得到 .java 源代码文件 2.使用javac编译得到 .class 字节码文件 3.使用java运行 注意事项 建议代码文件名全英文,首字母大写,满足驼峰命名法,源代码文件的后缀必须是.java 开发HelloWorld程序 &…...
计算机人工智能前沿进展-大语言模型方向-2024-09-12
计算机人工智能前沿进展-大语言模型方向-2024-09-12 1. PharmaBench: Enhancing ADMET benchmarks with large language models Z Niu, X Xiao, W Wu, Q Cai, Y Jiang, W Jin, M Wang… - Scientific Data, 2024 大语言模型在药物发现中的应用:PharmaBench 文章由…...
Android MediaPlayer + GLSurfaceView 播放视频
Android使用OpenGL 播放视频 概述TextureView的优缺点OpenGL的优缺点 实现复杂图形效果的场景参考 概述 在Android开发中,使用OpenGL ES来渲染视频是一种常见的需求,尤其是在需要实现自定义的视频播放界面或者视频特效时。结合MediaPlayer,我…...
gitee远程仓库OPEN GIT BASH HERE从错误中学习
推荐一个ai软件(搜索器搜索kimi),是一个ai,有什么错误跟着一步步解决就可以了 当你创建一个仓库 会出现这些 打开这个窗口跟着敲就行了 到这里为止我还没出现错误,后面我把remote add添加远程仓库的地址输错地址了 所…...
如何查看当前系统中所有具有sudo权限的用户?
要查看当前系统中所有具有 sudo 权限的用户,你可以使用以下方法: 方法一:查看 /etc/sudoers 文件 你可以直接查看 /etc/sudoers 文件,找到具有 sudo 权限的用户和用户组。请使用 visudo 命令来编辑和查看该文件,因为…...
MediaPipe实战:5分钟搞定人体姿态检测与3D坐标实时输出(附完整代码)
MediaPipe实战:5分钟搭建高精度人体姿态检测系统 当你第一次看到电影里的动作捕捉技术时,是否好奇过那些流畅的虚拟角色动画是如何实现的?如今,借助MediaPipe这个强大的开源框架,普通开发者也能在个人电脑上构建专业级…...
SiameseAOE中文-base实战教程:ABSA结果用于A/B测试——新旧版本UI情感变化分析
SiameseAOE中文-base实战教程:ABSA结果用于A/B测试——新旧版本UI情感变化分析 1. 快速了解SiameseAOE模型 SiameseAOE是一个专门用于中文属性情感抽取的模型,它能从文本中自动识别出属性词和对应的情感词。简单来说,就是能从用户评论中找出…...
VGG‘文艺复兴’背后的思考:从RepVGG看AI模型设计的‘简’与‘繁’哲学
VGG式架构的当代启示:当模型设计遇见"大道至简"的智慧 在深度学习模型架构的演进历程中,我们见证了一场耐人寻味的"轮回"——从早期VGG的极简主义,到Inception、ResNet等复杂多分支结构的盛行,再到如今RepVGG…...
Equalizer APO:在Windows音频处理中实现系统级音效精准调控
Equalizer APO:在Windows音频处理中实现系统级音效精准调控 【免费下载链接】equalizerapo Equalizer APO mirror 项目地址: https://gitcode.com/gh_mirrors/eq/equalizerapo Equalizer APO作为一款开源系统级音频处理引擎,通过Windows音频处理对…...
别再只用总基尼系数了!用Python实现Dagum分解,看清区域差距的‘里子’
用Python拆解经济差距:Dagum基尼系数分解实战指南 当一份区域经济报告只给出一个总的基尼系数时,就像医生只告诉你"体温偏高"却不说明是哪个器官发炎——数据研究者常陷入这种诊断困境。传统基尼系数虽能反映整体不平等程度,却无法…...
OpenClaw安全防护:运行百川2-13B-4bits模型时的5条系统权限建议
OpenClaw安全防护:运行百川2-13B-4bits模型时的5条系统权限建议 1. 为什么需要安全防护 当我第一次在本地部署OpenClaw并接入百川2-13B-4bits模型时,那种兴奋感至今难忘——终于可以在自己的电脑上运行一个强大的AI助手了。但很快,一个意外…...
AgentScope-Java:以 Agentic 为核心设计,构建可推理、可记忆、可扩展的生产级智能体系统
AgentScope-Java:以 Agentic 为核心设计,构建可推理、可记忆、可扩展的生产级智能体系统 副标题:从 ReActAgent、ReMe 记忆管理到高并发工程化落地,系统讲透 AgentScope-Java 的架构原理与企业级实践 一、为什么企业需要的不是“接个大模型”,而是 Agentic 系统 过去两年…...
AI原生应用中的个性化推荐算法实战解析
AI原生应用中的个性化推荐算法实战解析 关键词:AI原生应用、个性化推荐、协同过滤、深度学习推荐模型、冷启动问题 摘要:在AI技术深度渗透的今天,“AI原生应用”(AI Native Apps)已从概念走向落地。这类应用的核心特征…...
从Demo到生产级:免费开源Agentic RAG实战课程,手把手教你构建智能系统!
Production Agentic RAG Course是一个免费开源课程,旨在帮助开发者从零构建生产级Agentic RAG系统。课程分为5个模块,共17节课,涵盖架构设计、工具集成、性能优化和生产部署等关键内容。Agentic RAG通过引入Agent能力,实现主动规划…...
告别重复配置,用快马生成可共享的virtualbox开发环境模板提升团队效率
在团队协作开发中,最让人头疼的莫过于每个成员都要重复配置相同的开发环境。尤其是使用VirtualBox这类虚拟机时,从安装系统到配置依赖,往往要耗费数小时。最近我发现了一个能大幅提升效率的方法——通过InsCode(快马)平台生成可共享的Virtual…...
