当前位置: 首页 > news >正文

初探Ollama与deepseek

什么是Ollama?它与大模型有什么联系?

简单说,Ollama就像是你电脑上的一个 “大模型小助手”。

以前,很多强大的大语言模型,比如能回答各种问题、写文章、翻译等的那些模型,要么只能在网上的服务器上用,数据发过去存在隐私风险;要么就是运行起来特别复杂,对电脑要求很高,普通人很难自己在电脑上用。

而 Ollama 出现后,它能让你在自己的电脑上比较轻松地运行很多不同的大语言模型。就好比你有一个模型仓库,里面放着像 LLaMA、Mistral 这些大模型,只要你电脑性能允许,通过 Ollama 这个工具,你就能把这些模型 “召唤” 出来,让它们在你的电脑上干活,比如帮你写文案、陪你聊天等。

所以,Ollama 和大模型的关系就是,Ollama 是一个能让大模型在本地电脑更方便运行的工具平台,它给大模型提供了在本地运行的 “土壤”,让人们可以更自由、更安全地使用大模型,而不用完全依赖网络上的服务。

安装ollama

在这里插入图片描述

聊起来

在这里插入图片描述

实测deepseek 1.5b有点智障了 还是7B起。
在这里插入图片描述

构建对答UI窗口

可安装open-webui或Chatbox。

open-webui链接:
https://github.com/open-webui/open-webui

如果Ollama在您的计算机上,请使用以下命令:
命令:docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

如果Ollama在另一个服务器上,请使用以下命令:

要连接到其他服务器上的Ollama,请将OLLAMA_BASE_URL更改为服务器的URL:

docker run -d -p 3000:8080 -e OLLAMA_BASE_URL=https://example.com -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

要运行支持Nvidia GPU的Open WebUI,请使用以下命令:

docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

如果只使用OpenAI API,请使用以下命令:

docker run -d -p 3000:8080 -e OPENAI_API_KEY=your_secret_key -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

安装好后效果:
Open WebUI

**安装ChatBox,**链接:
ChaBox

CHatbox UI对话效果图

相关文章:

初探Ollama与deepseek

什么是Ollama?它与大模型有什么联系? 简单说,Ollama就像是你电脑上的一个 “大模型小助手”。 以前,很多强大的大语言模型,比如能回答各种问题、写文章、翻译等的那些模型,要么只能在网上的服务器上用&am…...

Linux top 常用参数记录

top命令经常用来监控linux的系统状况,能实时显示系统中各个进程、线程的资源占用情况,是常用的性能分析工具。 一些常用参数记录 top的使用方式 top [-d number] | top [-bnp] # 5s 更新一次 top -d 5# 进行2次top命令的输出结果 top -n 2# 查看进程的…...

CCF-CSP认证 202104-1灰度直方图

题目描述 思路 首先输入矩阵长度、矩阵宽度和灰度范围&#xff0c;结果数组长度可固定&#xff0c;其中的元素要初始化为0。在输入灰度值的时候&#xff0c;结果数组中以该灰度值为索引的元素值1&#xff0c;即可统计每个灰度值的数量。 代码 C版&#xff1a; #include <…...

怎么下载安装yarn

安装 npm install --global yarn 是否安装成功 yarn -v Yarn 淘宝源安装&#xff0c;分别复制粘贴以下代码行到黑窗口运行即可 yarn config set registry https://registry.npm.taobao.org -g yarn config set sass_binary_site http://cdn.npm.taobao.org/dist/…...

Vulhub靶机 AppWeb认证绕过漏洞(CVE-2018-8715)(渗透测试详解)

一、开启vulhub环境 docker-compose up -d 启动docker ps 查看开放的端口 影响版本 Appweb 7.0.2以及之前的版本 二、访问靶机IP 8080端口 访问IP会弹出个登录框 1、随便输个用户名&#xff0c;利用burp抓包 2、修改数据包 &#xff0c;发包 Authorization: Digest usern…...

CSS 系列之:grid 布局

基本概念 <template><div class"parent"><div class"box">p1-1</div><div class"box">p1-2</div><div class"box">p1-3</div></div><div class"parent"><…...

DeepSeek MLA(Multi-Head Latent Attention)算法浅析

目录 前言1. 从MHA、MQA、GQA到MLA1.1 MHA1.2 瓶颈1.3 MQA1.4 GQA1.5 MLA1.5.1 Part 11.5.2 Part 21.5.3 Part 3 结语参考 前言 学习 DeepSeek 中的 MLA 模块&#xff0c;究极缝合怪&#xff0c;东抄抄西抄抄&#xff0c;主要 copy 自苏神的文章&#xff0c;仅供自己参考&#…...

【计算机网络入门】初学计算机网络(七)

目录 1. 滑动窗口机制 2. 停止等待协议&#xff08;S-W&#xff09; 2.1 滑动窗口机制 2.2 确认机制 2.3 重传机制 2.4 为什么要给帧编号 3. 后退N帧协议&#xff08;GBN&#xff09; 3.1 滑动窗口机制 3.2 确认机制 3.3 重传机制 4. 选择重传协议&#xff08;SR&a…...

Conda 环境搭建实战:从基础到进阶

在当今复杂多变的软件开发与数据科学领域&#xff0c;拥有一个稳定、可复现且易于管理的开发环境是项目成功的基石。Conda 作为一款强大的跨平台环境管理与包管理工具&#xff0c;为开发者提供了便捷高效的环境搭建与依赖管理解决方案。本文将深入探讨 Conda 环境搭建的实战技巧…...

大数据-236 离线数仓 - 会员活跃度 WDS 与 ADS 导出到 MySQL 与 广告业务 需求分析

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; Java篇开始了&#xff01; 目前开始更新 MyBatis&#xff0c;一起深入浅出&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff0…...

fps项目总结:关于攻击与受击

文章目录 战斗交互攻击方命中区间 双方命中响应 攻击方&#xff1a;指定攻击动画指定动画命中区间&#xff1a;在动画中指定攻击范围以及命中响应动画通知&#xff1a;动画中攻击的开关——调用蓝图攻击函数&#xff1a;实现攻击检测以及命中响应通道检测&#xff1a;——自定义…...

coze生成的工作流,发布后,利用cmd命令行执行。可以定时发日报,周报等。让他总结你飞书里面的表格。都可以

coze生成的工作流&#xff0c;发布后&#xff0c;利用cmd命令行执行。可以定时发日报&#xff0c;周报等。让他总结你飞书里面的表格。都可以。 很简单。 准备工作&#xff0c;先发布你的工作流&#xff0c;和发布应用。 然后&#xff0c;点击扣子API 。 申请一个&#xff0…...

Windows 10 远程桌面连接使用指南

目录 一、引言 二、准备工作 1、确认系统版本 2、服务器端设置 三、客户端连接 1、打开远程桌面连接程序 2、输入连接信息 3、输入登录凭证 4、开始使用远程桌面 四、移动端连接&#xff08;以 iOS 为例&#xff09; 1、下载安装应用 2、添加远程计算机 3、进行连接…...

Difyにboto3を変更したカスタムDockerイメージの構築手順

Difyにboto3を変更したカスタムDockerイメージの構築手順 はじめに1. Dockerfileの作成2. Dockerイメージのビルド3. docker-compose.yamlの更新変更点&#xff1a; 4. コンテナの再起動注意事項まとめ はじめに DifyのDockerイメージに特定バージョンのboto3を変更する手順を…...

C++性能优化常用技巧

一. 选择合适的数据结构 1.1 map与unordered_map的选择 如果仅仅只需要使用到快速查找的特性&#xff0c;那么unordered_map更加合适&#xff0c;他的复杂度是O(1)。如果还需要排序以及范围查找的能力&#xff0c;那么就选择map。 1.2 vector与list的选择 通常情况下&#…...

IntelliJ IDEA集成MarsCode AI

IntelliJ IDEA集成MarsCode AI IDEA中安装插件 安装完毕之后登录自己的账号 点击链接&#xff0c;注册账号 https://www.marscode.cn/events/s/i5DRGqqo/ 可以选择不同的模型...

数据挖掘工程师的技术图谱和学习路径

数据挖掘工程师的技术图谱和学习路径: 1.基础知识 数据挖掘工程师是负责从大量数据中发现潜在模式、趋势和规律的专业人士。以下是数据挖掘工程师需要掌握的基础知识: 数据库知识:熟悉关系数据库和非关系数据库的基本概念和操作,掌握SQL语言。 统计学基础:了解统计学的基…...

Excel基础(详细篇):总结易忽视的知识点,有用的细节操作

目录 基础篇Excel主要功能必会快捷键LotusExcel的文件类型工作表基本操作表项操作选中与缩放边框线 自动添加边框线格式刷设置斜线表头双/多斜线表头不变形的:双/多斜线表头插入多行、多列单元格/行列的移动冻结窗口 方便查看数据打印的常见问题Excel格式数字格式日期格式文本…...

基因枷锁下的太空梦 —— 千钧一发电影观后感

目录 1 人物介绍 2 电影名解读 3 电影开头 3.1 电影开头的两段话 3.2 片头设计 4 电影正文 4.1 “杰罗米”各种诡异的行为 4.2 文森特 – 失败的man 4.3 真正的杰罗米以及假基因身份证 4.4 文森特新征程 4.5 基因人的不容易 4.6 睫毛被查出有问题 4.7 文森特身份初…...

leetcode第40题组合总和Ⅱ

原题出于leetcode第40题https://leetcode.cn/problems/combination-sum-ii/题目如下&#xff1a; 给定一个候选人编号的集合 candidates &#xff08;candidate中有重复的元素&#xff09;和一个目标数 target &#xff0c;找出 candidates 中所有可以使数字和为 target 的组合…...

告别普通回归!R 语言混合效应 (多水平 / 嵌套) 模型 + 贝叶斯实现,一篇学会

在科研数据分析里&#xff0c;普通回归已经不够用了。你是不是经常遇到&#xff1a;数据有分层、嵌套、多水平结构&#xff0c;普通回归不准&#xff1f;计数数据、0-1 数据、过度离散、零膨胀&#xff0c;不会选模型&#xff1f;时空自相关、系统发育数据&#xff0c;不知道怎…...

代码优化的10个技巧:让你的代码既高效又优雅

对于软件测试从业者而言&#xff0c;编写高质量的测试代码是保障测试效率、提升测试可靠性的核心基础。无论是自动化测试脚本、测试工具开发还是测试框架搭建&#xff0c;臃肿、低效、可读性差的代码不仅会拖慢测试执行速度&#xff0c;还会增加缺陷排查的难度&#xff0c;提升…...

CUDA为什么能统治AI世界?NVIDIA真正可怕的并不是GPU

前言很多人第一次接触AI行业时&#xff0c;都会听到一个词&#xff1a;CUDA。而且你会发现一个非常奇怪的现象&#xff1a;很多AI框架、深度学习项目、GPU训练环境&#xff0c;几乎都默认要求&#xff1a;NVIDIA显卡CUDA环境甚至很多时候&#xff1a;没有CUDA&#xff0c;AI项目…...

UE5 GAS中安全修改Attribute值的四种正确方式

1. 这不是简单的“赋值操作”&#xff0c;而是GAS系统中一次精准的属性干预在UE5的Gameplay Ability System&#xff08;GAS&#xff09;架构下&#xff0c;修改一个Attribute的值——比如让角色的生命值从100变成120&#xff0c;或者让法力值在施法后扣减30点——表面看只是调…...

NotebookLM默认α=0.05合理吗?(基于127个真实知识图谱实验的P值稳健性评估报告)

更多请点击&#xff1a; https://codechina.net 第一章&#xff1a;NotebookLM默认α0.05合理吗&#xff1f;&#xff08;基于127个真实知识图谱实验的P值稳健性评估报告&#xff09; 在NotebookLM的知识图谱推理链中&#xff0c;显著性阈值α被硬编码为0.05&#xff0c;该设定…...

深度解析vLLM-Ascend技术架构:从分布式并行到算子优化的全栈实践指南

深度解析vLLM-Ascend技术架构&#xff1a;从分布式并行到算子优化的全栈实践指南 【免费下载链接】vllm-ascend Community maintained hardware plugin for vLLM on Ascend 项目地址: https://gitcode.com/gh_mirrors/vl/vllm-ascend vLLM-Ascend作为昇腾硬件上的高性能…...

Saleor:应对现代电商架构挑战的无头商业引擎解决方案

Saleor&#xff1a;应对现代电商架构挑战的无头商业引擎解决方案 【免费下载链接】saleor Saleor Core: the high performance, composable, headless commerce API. 项目地址: https://gitcode.com/gh_mirrors/sa/saleor 在数字化转型浪潮中&#xff0c;电商平台面临的…...

Generative AI落地四层架构与企业级避坑指南

1. 这不是“AI画画”或“AI写文案”——它是一场底层认知范式的迁移Generative AI&#xff0c;这个词现在几乎天天刷屏&#xff0c;但很多人点开一篇介绍&#xff0c;看到的还是“用MidJourney生成海报”“让ChatGPT写周报”这类表层操作。这就像当年第一次听说“互联网”&…...

MySQL 性能监控实战:从零搭建 Prometheus + Grafana 监控告警体系(附排查 SOP)

&#x1f4cc; 今日关键词&#xff1a;性能监控、PMM、Prometheus、Grafana、慢查询、告警、指标体系 大家好&#xff0c;我是数据库小学妹 &#x1f44b; 前面我们学习了锁机制、MVCC、慢查询诊断这些"事后分析"的技术。但你知道“数据库目前处于什么状态&#xff1…...

跨镜头人物ID稳定性不足,深度拆解Sora 2的Temporal Identity Token机制与3层对抗对齐策略

更多请点击&#xff1a; https://kaifayun.com 第一章&#xff1a;跨镜头人物ID稳定性不足的根源诊断 跨镜头人物ID稳定性不足是多目标跟踪&#xff08;MOT&#xff09;系统在真实监控场景中面临的核心瓶颈。其本质并非单一模块失效&#xff0c;而是特征表征、时空建模与数据分…...