潇洒郎:部署Dify, 安装Ollama,Ollama下载模型,Dify配置模型



Ollama
1、安装ollama
Windows版本下载:2024WindowsOllama最新0.5.4版本资源-CSDN文库, 下载速度超快,官网太慢了
双击安装,安装成功后,托盘区有Ollama图标
右键View logs打开目录
C:\Users\Administrator\AppData\Local\Ollama
Ollama安装位置并添加环境变量
C:\Users\Administrator\AppData\Local\Programs\Ollama
Ollama app: C:\Users\Administrator\AppData\Local\Programs\Ollama\ollama app.exe
2、修改Ollama监听端口
如修改为8000,不修改其他机器无法访问,因为Ollama默认绑定localhost或者127.0.0.1
先结束托盘区的Ollama, 再添加环境变量OLLAMA_HOST为:18000
Windows开放8000端口访问或者关闭防火墙
netsh advfirewall set allprofiles state off
测试Ollama在运行
http://192.168.146.101:18000
3、ollama拉取镜像
ollama pull snowflake-arctic-embed2:latest
ollama pull bge-m3:latest
ollama pull qwen2.5:7b
ollama pull glm4:9b
ollama pull llama2-chinese:7b
ollama pull llama3.2:3b
4、ollama查看镜像
5、ollama部署web-ui
git clone https://github.com/open-webui/open-webui.git
cd open-webui
docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://192.168.1.17:50080 --name open-webui --restart always ghcr.io/open-webui/open-webui:main
Dify
1、安装部署Dify
# 下载源码
git clone https://gitee.com/liuchuangjun/dify.git
(注意gitee中代码最新为0.6.11, 不支持chatflow)
需要去github上下载源码
https://github.com/langgenius/dify.git
cd dify
# 安装运行docker compose
cd docker
docker compose up -d
(如果失败则单独拉取镜像
docker pull langgenius/dify-api:0.6.11
docker pull langgenius/dify-web:0.6.11
docker pull langgenius/dify-sandbox:0.2.1
docker pull semitechnologies/weaviate:1.19.0
)
# 注册管理员账号
http://192.168.1.39/install
2、添加成员
相关文章:
潇洒郎:部署Dify, 安装Ollama,Ollama下载模型,Dify配置模型
Ollama 1、安装ollama Windows版本下载:2024WindowsOllama最新0.5.4版本资源-CSDN文库, 下载速度超快,官网太慢了 双击安装,安装成功后,托盘区有Ollama图标 右键View logs打开目录 C:\Users\Administrator\AppData\Local\Oll…...
Joget研究——Joget8商业版部署
大纲 1. 环境准备1.1 安装必要软件1.2 配置Java1.3 配置MySQL数据库1.3.1 创建用户1.3.2 创建数据库 2. 下载和部署3. 启动4. 测试5. 商业版社区版对比 1. 环境准备 1.1 安装必要软件 We recommend the use of the LTS version of 11. Java 17 (LTS) is not supported at the …...
Linux下学【MySQL】表中插入和查询的进阶操作(配实操图和SQL语句通俗易懂)
绪论 每日激励:挫折是会让我们变得越来越强大的重点是我们敢于积极的面对它。—Jack叔叔 绪论: 本章是表操作的进阶篇章(没看过入门的这里是传送门,本章将带你进阶的去学习表的插入insert和查找select,本质也就是…...
从百度云网盘下载数据到矩池云网盘或者服务器内
本教程教大家如何快速将百度云网盘数据集或者模型代码文件下载到矩池云网盘或者服务器硬盘上。 本教程使用到了一个开源工具 BaiduPCS-Go,官方地址 : https://github.com/qjfoidnh/BaiduPCS-Go 这个工具可以实现“仿 Linux shell 文件处理命令的百度网…...
Vue.js 高级组件开发:抽象与高性能架构
Vue.js 高级组件开发:抽象与高性能架构 引言一、动态组件与依赖注入1. 动态组件场景 二、高可扩展性的抽象组件模式1. 设计思路2. 案例:抽象数据表组件 三、复杂场景下的异步操作管理1. 使用 Vue Composition API 管理异步逻辑 四、渲染优化与框架底层钩…...
Kubernetes 安装 Nginx以及配置自动补全
部署 Nginx : [rootk8s-master ~]# kubectl create deployment nginx --imagenginx:1.14-alpine deployment.apps/nginx created暴露端口: [rootk8s-master ~]# kubectl expose deployment nginx --port80 --typeNodePort service/nginx exposed查看服…...
CSS---实现盒元素div内input/textarea的focus状态时给父元素加属性!
注意兼容性,低版本浏览器无效 要实现当 textarea 文本框获得焦点时,自动给其父元素添加类名或样式,您可以使用 CSS 的 :focus-within 伪类选择器。这个选择器会在元素本身或其任何子元素获得焦点时应用样式。 示例代码 假设您有以下 HTML 结…...
jmeter设置tps、响应时间监测时间间隔
jmeter设置tps、响应时间监测时间间隔 思路: 1、设置tps和响应时间插件的采集时间间隔,然后运行jmeter脚本; 2、先按默认配置跑出jtl文件保存下来,再添加tps和响应时间插件,设置采集时间间隔后,导入jtl文件…...
WPSJS:让 WPS 办公与 JavaScript 完美联动
随着办公自动化需求的日益增长,WPS Office 推出了 WPSJS,这是一款强大的开发者工具,允许开发者通过 JavaScript 脚本与 WPS 办公软件进行互动。无论是在表格中自动填充数据、在文档中修改格式,还是在演示文稿中插入动态内容&#…...
深度学习与图像处理(国产深度学习框架——飞桨官方指定教材)
计算机视觉从小白到大师之路 《深度学习与图像处理(PaddlePaddle版)》这一本就够了 1.引言 随着人工智能技术的飞速发展,各行各业对深度学习、图像处理相关领域的人才需求日益迫切。本书旨在通过系统的理论讲解与丰富的实战案例࿰…...
taiwindcss
1.安装 npm install -D tailwindcss postcss autoprefixer npx tailwindcss init 这会创建一个 tailwind.config.js 文件。注意:一定通过px tailwindcss init方式创建 2.tailwind.config.js module.exports {content: [./index.html,./src/**/*.{js,ts,jsx,ts…...
信号的时域截断——频谱泄漏——光晕效应
在时域信号中,如果对一个包含不连续点的信号进行截断,即使用有限个样本点来表示原本无限长或更长的信号,那么在频域中这相当于对信号进行了乘以一个矩形窗的操作。这种操作会导致原信号频谱与矩形窗的频谱卷积,从而在频域中引入额…...
【Linux编程】TcpServer 类的设计与实现:构建高性能的 TCP 服务器(二)
TcpServer 类的设计与实现:构建高性能的 TCP 服务器 在现代网络编程中,构建一个高效、稳定的 TCP 服务器是许多网络应用的基础。本文将详细介绍一个基于 C 的 TcpServer 类的设计与实现,该类提供了创建 TCP 服务器、处理客户端连接、数据传输…...
Mono里运行C#脚本8—mono_image_storage_open打开EXE文件
Mono里运行C#脚本8—mono_image_storage_open打开EXE文件 前面分析哈希表的实现,以及文件打开的底层函数,还有保存到HASH表里的数据结构。 static MonoImageStorage * mono_image_storage_open (const char *fname) { char *key = NULL; key = mono_path_resolve_symlinks…...
XMLHttpRequest的基础知识
get请求 const xml new XMLHttpRequest(); xml.open("GET", "https://jsonplaceholder.typicode.com/todos/1", true); xml.onreadystatechange function () {if (xml.readyState 4 && xml.status 200) {console.log(xml.responseText);} }…...
力扣矩阵-算法模版总结
lc-73.矩阵置零-(时隔14天)-12.27 思路:(23min22s) 1.直接遍历遇0将行列设0肯定不行,会影响后续判断,题目又要求原地算法,那么进一步考虑是否可以将元素为0,其行列需要设为0的位置给存储下来,最后再遍历根据…...
如何在短时间内读懂复杂的英文文献?
当我们拿起一篇文献开始阅读时,就像是打开了一扇通往未知世界的大门。但别急着一头扎进去,咱们得像个侦探一样,带着疑问去探险。毕竟,知识的海洋深不可测,不带点“装备”怎么行?今天就聊聊,平时…...
基于aspose.words组件的word bytes转pdf bytes,去除水印和解决linux中文乱码问题
详情见 https://preferdoor.top/archives/ji-yu-aspose.wordszu-jian-de-word-byteszhuan-pdf-bytes...
Bert中文文本分类
这是一个经典的文本分类问题,使用google的预训练模型BERT中文版bert-base-chinese来做中文文本分类。可以先在Huggingface上下载预训练模型备用。https://huggingface.co/google-bert/bert-base-chinese/tree/main 我使用的训练环境是 pip install torch2.0.0; pi…...
【深度学习】Java DL4J基于 CNN 构建车辆识别与跟踪模型
🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…...
CS231n实战解析:从HOG/HSV特征到图像分类性能提升
1. 图像特征工程入门:为什么HOG和HSV如此重要 第一次接触CS231n作业时,我对HOG和HSV这两个特征提取方法感到既陌生又好奇。直到在CIFAR-10数据集上做了对比实验才发现,使用原始像素训练的模型准确率只有0.51,而加入特征工程后直接…...
光伏电站电流传感器选型与应用全解析
摘要:本文深入探讨光伏电站中电流传感器的选型要点与应用技术。阐述了电流传感器在光伏系统中的重要性,分析其不同技术原理及特点,并结合光伏电站实际工况,从量程、精度、隔离耐压等方面详细介绍选型方法,同时分享了电…...
用STM32CubeMX和TMC260驱动步进电机,这份PWM频率配置指南帮你避开新手常见坑
STM32CubeMX与TMC260步进电机驱动实战:PWM频率配置的黄金法则 第一次用STM32CubeMX配置TMC260驱动步进电机时,我盯着屏幕上那一堆定时器参数发愣——Prescaler、Period、Counter Mode...这些看似简单的数字背后,藏着让电机平稳运转或是疯狂抖…...
DeOldify性能基准测试:不同GPU配置下的处理速度对比
DeOldify性能基准测试:不同GPU配置下的处理速度对比 最近在折腾老照片修复,用上了DeOldify这个工具。效果确实惊艳,能把黑白照片变得色彩鲜活。但有个问题一直困扰我:处理速度。一张照片等几分钟还能接受,要是批量处理…...
用Python手搓一个简易飞行仿真器:从状态机到轨迹计算的保姆级教程
用Python手搓一个简易飞行仿真器:从状态机到轨迹计算的保姆级教程 飞行仿真技术听起来像是航空航天工程师的专属领域,但你知道吗?用Python和一些基础库,我们完全可以构建一个简化版的飞行仿真系统。本文将带你从零开始࿰…...
开源大模型效果展示:Pixel Language Portal对emoji+文字混合输入的语义解析
开源大模型效果展示:Pixel Language Portal对emoji文字混合输入的语义解析 1. 项目概览 Pixel Language Portal(像素语言跨维传送门)是一款基于Tencent Hunyuan-MT-7B大模型构建的创新翻译工具。与传统翻译软件不同,它将语言转换…...
Wan2.2-I2V-A14B参数详解:--output路径修改与/workspace目录结构说明
Wan2.2-I2V-A14B参数详解:--output路径修改与/workspace目录结构说明 1. 镜像概述与核心功能 Wan2.2-I2V-A14B是一款专为文生视频任务优化的私有部署镜像,基于RTX 4090D 24GB显存显卡深度调优。这个镜像最大的特点是开箱即用,内置了完整的运…...
Ostrakon-VL-8B在VMware虚拟机中的一站式部署与性能调优
Ostrakon-VL-8B在VMware虚拟机中的一站式部署与性能调优 想在本地隔离环境里跑通一个强大的多模态大模型,比如Ostrakon-VL-8B,但又不想折腾物理机或者担心影响主系统?VMware虚拟机是个不错的选择。不过,在虚拟机里部署AI应用&…...
Pixel Epic · Wisdom Terminal 处理403 Forbidden等HTTP错误:智能诊断与修复建议
Pixel Epic Wisdom Terminal 处理403 Forbidden等HTTP错误:智能诊断与修复建议 1. 引言:HTTP错误的困扰与解决方案 每个Web开发者和运维人员都遇到过这样的场景:用户反馈页面打不开,你打开开发者工具一看,赫然显示4…...
OpenClaw+Qwen3-14b_int4_awq:3种降低token消耗的实战技巧
OpenClawQwen3-14b_int4_awq:3种降低token消耗的实战技巧 1. 为什么我们需要关注token消耗 第一次看到OpenClaw的token账单时,我差点从椅子上跳起来。一个简单的文件整理任务竟然消耗了接近5000个token,这还只是测试环境下的单次运行。当我…...

