当前位置：首页 > news >正文

【xinference】（15）：在compshare上，使用docker-compose运行xinference和chatgpt-web项目，配置成功！！！

news 2026/4/6 2:54:07

视频演示

1，安装docker方法：

#!/bin/shdistribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.listsudo apt-get update && sudo apt-get install -y nvidia-container-toolkit nvidia-docker2echo "install docker finish ."sudo curl -L "https://github.com/docker/compose/releases/download/v2.28.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod 755 /usr/local/bin/docker-compose echo "install docker-compose finish ."# 把当前用户加入到 docker 组；
sudo gpasswd -a $USER docker
# 更新docker组
newgrp docker
# 增加自动启动
sudo systemctl enable docker
sudo systemctl restart dockerecho "add docker user finish ."

2，然后就可以启动docker-compose了

version: '3.5'services:##################### 使用xinference部署大模型 ###################### docker 文档
# https://inference.readthedocs.io/zh-cn/latest/getting_started/using_docker_image.html#docker-image
# 使用qwen2大模型
# https://inference.readthedocs.io/zh-cn/latest/models/builtin/llm/qwen2-instruct.html
# 启动 7b模型
# xinference launch --model-engine vllm --model-name qwen2-instruct --size-in-billions 7 --model-format awq --quantization Int4xinf:restart: alwayscontainer_name: xinfimage: xprobe/xinference:latest# 使用 GPU 资源。deploy:resources:reservations:devices:- driver: "nvidia"count: "all"capabilities: ["gpu"]ports:- 9997:9997environment:- XINFERENCE_MODEL_SRC=modelscopevolumes:- ./xinf-cache/:/root/.cache# 命令启动 xinference entrypoint: xinference-local -H 0.0.0.0 --log-level debug## https://github.com/Chanzhaoyu/chatgpt-webapp:image: chenzhaoyu94/chatgpt-web container_name: appports:- 8188:3002environment:# choose oneOPENAI_API_KEY: sk-xxx# choose oneOPENAI_ACCESS_TOKEN: xxx# API interface address, optional, available when OPENAI_API_KEY is setOPENAI_API_BASE_URL: http://xinf:9997/v1# API model, optional, available when OPENAI_API_KEY is set, https://platform.openai.com/docs/models# gpt-4, gpt-4-turbo-preview, gpt-4-0125-preview, gpt-4-1106-preview, gpt-4-0314, gpt-4-0613, gpt-4-32k, gpt-4-32k-0314, gpt-4-32k-0613, gpt-3.5-turbo-16k, gpt-3.5-turbo-16k-0613, gpt-3.5-turbo, gpt-3.5-turbo-0301, gpt-3.5-turbo-0613, text-davinci-003, text-davinci-002, code-davinci-002OPENAI_API_MODEL: qwen2-instruct# reverse proxy, optionalAUTH_SECRET_KEY:# maximum number of requests per hour, optional, unlimited by defaultMAX_REQUEST_PER_HOUR: 0# timeout, unit milliseconds, optionalTIMEOUT_MS: 60000networks:default:name: xinf-network

然后需要登陆到xinf 启动模型：

xinference launch --model-engine vllm --model-name qwen2-instruct --size-in-billions 7 --model-format awq --quantization Int4

3，启动成功之后就访问了

在这里插入图片描述
效果还不错！

【xinference】（15）：在compshare上，使用docker-compose运行xinference和chatgpt-web项目，配置成功！！！

视频演示【xinference】（15）：在compshare上，使用docker-compose运行xinference和chatgpt-web项目，配置成功！！！ 1，安装docker方法： #!/bin/shdistribution$(…...

编程日记 2024/7/7 18:38:03

【Unity 3D角色移动】

【Unity 3D角色移动】在Unity 3D中实现角色移动通常涉及到几个关键步骤，包括设置角色的物理属性、处理输入、更新角色的位置以及动画同步。下面是实现基本3D角色移动的步骤和示例代码： 步骤1：设置角色的物理属性角色通常使用Character Co…...

编程日记 2024/7/7 18:37:02

个人视角，社会影响力：自媒体的魅力所在

随着数字化时代的到来，自媒体正成为信息传播领域的一场革命。个人视角与社会影响力的结合，赋予了自媒体独特的魅力。在传统媒体受限制的同时，自媒体为每个人提供了表达自己观点和思想的自由。个体的真实视角使得自媒体在信息传播中发挥着重要…...

编程日记 2024/7/7 18:36:01

题目1：108. 冗余连接 (kamacoder.com) #include<iostream> #include<vector>using namespace std;int n; vector<int> father(10001, 0);void init() {for(int i 1;i < n;i) father[i] i; }int find(int u) {return u father[u] ? u : fa…...

编程日记 2024/7/7 18:34:59

EtherCAT转Profinet网关配置说明第二讲：上位机软件配置

EtherCAT协议转Profinet协议网关模块（XD-ECPNS20），不仅可以实现数据之间的通信，还可以实现不同系统之间的数据共享。EtherCAT协议转Profinet协议网关模块（XD-ECPNS20）具有高速传输的特点，因此通…...

编程日记 2024/7/7 18:33:58

日志自动分析-Web---360星图GoaccessALBAnolog

目录 1、Web-360星图(IIS/Apache/Nginx) 2、Web-GoAccess （任何自定义日志格式字符串） 源码及使用手册安装goaccess 使用输出 3-Web-自写脚本（任何自定义日志格式字符串） 4、Web-机器语言analog（任何自定义日…...

编程日记 2024/7/7 18:32:57

【面试八股文】java基础知识

引言本文是java面试时的一些常见知识点总结归纳和一些拓展，笔者在学习这些内容时，特地整理记录下来，以供大家学习共勉。一、数据类型 1.1 为什么要设计封装类，Integer和int区别是什么？ 使用封装类的目的对象化:…...

编程日记 2024/7/7 18:31:56

ssrf结合redis未授权getshell

目录漏洞介绍 SSRF Redis未授权利用原理环境搭建利用过程 rockylinux cron计划任务反弹shell 写公钥免密登录 ubuntu 写公钥免密登录漏洞介绍 SSRF SSRF（server side request forgrey）服务端请求伪造，因后端未过滤用户输入&…...

编程日记 2024/7/7 18:30:54

魔法自如：精通 IPython %automagic 命令的切换艺术

魔法自如：精通 IPython %automagic 命令的切换艺术在 IPython 的神奇世界里，魔术命令是其强大交互功能的核心。这些以 % 或 %% 开头的命令，能够执行一系列特殊的操作，从而增强用户的编程体验。但是，你是否知道&#…...

编程日记 2024/7/7 18:29:53

基于CentOS Stream 9平台搭建MinIO以及开机自启

1. 官网 https://min.io/download?licenseagpl&platformlinux 1.1 下载二进制包指定目录下载 cd /opt/coisini/ wget https://dl.min.io/server/minio/release/linux-amd64/minio1.2 文件赋权 chmod x /opt/coisini/minio1.3 创建Minio存储数据目录： mkdi…...

编程日记 2024/7/7 18:27:51

shell-awk语法整理

shell-awk语法整理前言基本语法内置变量1. $02. NF3. NR4. FS5. RS6. OFS7. ORS8. FILENAME9. FNR10. ARGV11. ENVIRON12. IGNORECASE13. RSTART 和 RLENGTH示例解释内置函数循环语句（后面的;可不加）条件语句高级特性示例特殊模式BEGINEND组合示例BEG…...

编程日记 2024/7/7 18:26:49

关于忠诚：忠于自己的良知、理想、信念

关于忠诚： 当我们面对公司、上司、爱人、恋人、合作伙伴还是某件事，会纠结离开还是留下，这里我们要深知忠诚的定义，我们不是忠诚于某个人、某件事、或者某个机构，而是忠诚于自己的良知，忠诚于自己的理想和…...

编程日记 2024/7/7 18:23:45

探索Linux：开源世界的无限可能

Linux是一款开源操作系统，它的起源可以追溯到上世纪90年代初。这个故事始于一个名叫Linus Torvalds的芬兰大学生，他在1983年开始编写一个用于个人电脑的操作系统内核。在他的努力下，Linux逐渐发展成为一个稳定而强大的操作系统。然而&#…...

编程日记 2024/7/7 18:19:40

深度学习之半监督学习：一文梳理目标检测中的半监督学习策略

什么是半监督目标检测？ 传统机器学习根据训练数据集中的标注情况，有着不同的场景，主要包括：监督学习、弱监督学习、弱半监督学习、半监督学习。由于目标检测任务的特殊性，在介绍半监督目标检测方法之前，我…...

编程日记 2024/7/7 18:15:33

Hive 高可用分布式部署详细步骤

目录系统版本说明 hive安装包下载及解压上传mysql-connector-java的jar包配置环境变量进入conf配置文件中，将文件重命名在hadoop集群上创建文件夹创建本地目录修改hive-site.xml文件同步到其他的节点服务器修改node02中的配置 hive-site.xml 修改…...

编程日记 2024/7/7 18:14:32

ubuntu下运行程序时提示缺库问题的有效解决方法

目录一、问题现象二、解决方式三、总结一、问题现象当我们平时在ubuntu上运行一个程序时时长会遇到如下情况，含义为本机缺少执行程序需要的库这时候我们可能会根据缺少的库使用apt install 库名的模糊名字进行安装，然后再去运行，此时可…...

编程日记 2024/7/7 18:13:30

GNU/Linux - wic文件的使用

Yocto/OpenEmbedded使用的磁盘镜像格式是 wic。为嵌入式系统提供 bootable images。 The disk image format used in the Yocto Project is wic. .wic 文件显然只是一个带有分区表和分区的磁盘镜像，就像下载 Linux 发行版时获得的所有 .img 文件一样。这就是为什么你…...

编程日记 2024/7/7 18:12:29

前端JS 插件实现下载【js-tool-big-box，下载大文件（fetch请求 + 下载功能版）

上一节，我们添加了下载大文件的纯功能版，意思就是需要开发者，在自己项目里发送请求，请求成功后，获取文件流的blob数据，然后 js-tool-big-box 帮助下载。但考虑到，有些项目，可能比较…...

编程日记 2024/7/7 18:10:26

JVM专题之垃圾收集器

JVM参数 3.1.1 标准参数 -version -help -server -cp 3.1.2 -X参数非标准参数，也就是在JDK各个版本中可能会变动 ``` -Xint 解释执行 -Xcomp 第一次使用就编译成本地代码 -Xmixed 混合模式，JVM自己来决定 3.1.3 -XX参数 > 使用得最多的参数类型 > > 非…...

编程日记 2024/7/7 18:09:24

SSM养老院管理系统-计算机毕业设计源码02221

摘要本篇论文旨在设计和实现一个基于SSM的养老院管理系统，旨在提供高效、便捷的养老院管理服务。该系统将包括老人档案信息管理、护工人员管理、房间信息管理、费用管理等功能模块，以满足养老院管理者和居民的不同需求。通过引入SSM框架&#x…...

编程日记 2024/7/7 18:08:23

KL46Z电容触摸驱动库：TSI传感器适配与抗干扰实践

1. TSI传感器驱动库技术解析与工程实践1.1 项目背景与定位TSI（Touch Sensing Interface）是NXP Kinetis系列MCU内置的电容式触摸感应外设模块，专为低功耗、高抗噪性的人机交互应用设计。tsi_sensor是一个轻量级、可移植的固件库，面…...

编程新知 2026/4/6 2:18:18

从“馒头波”到正弦波：深入理解PFC如何拯救你的电源功率因数

从“馒头波”到正弦波：深入理解PFC如何重塑电能质量当我们拆开一台现代电子设备时，电源部分总能看到一个标着"PFC"的电路模块。这个看似简单的缩写背后，隐藏着电力电子领域最精妙的能量控制艺术——它能让原本畸变的电流波形重获新…...

编程新知 2026/4/6 2:06:16

SpringCloud快速入门--GateWay路由网关与Config配置中心

背景 StreamJsonRpc 是微软官方维护的用于 .NET 和 TypeScript 的 JSON-RPC 通信库，以其强大的类型安全、自动代理生成和成熟的异常处理机制著称。在 HagiCode 项目中，为了通过 ACP (Agent Communication Protocol) 与外部 AI 工具（如 iflow …...

编程新知 2026/4/6 1:25:42

2026最权威的十大降AI率平台实测分析

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 此刻，AI生成那种内容的检测变得越发严格起来，降AI工具就顺势产生了&a…...

编程新知 2026/4/5 22:39:06

2026届毕业生推荐的AI学术工具实测分析

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 于毕业论文写作进程里，人工智能工具可充作辅助方式用以提高效率。学生能借AI开展…...

编程新知 2026/4/5 22:33:05

Linux进程信号详解（二）：信号产生

当前阶段：一、通过终端按键产生信号1.1 基本操作CtrlC → SIGINTCtrl\ → SIGQUIT 可以发送终止信号Ctrl Z -> SIGSTP 可以发送停止信号，将当前前台进程挂起到后台设置所有信号都可以自定义捕捉 ： 1.2 理解OS如何得知键盘有数据1.3 初步理…...

编程新知 2026/4/5 20:48:49

OpenClaw安全配置指南：Qwen3-14b_int4_awq模型权限管理

OpenClaw安全配置指南：Qwen3-14b_int4_awq模型权限管理 1. 为什么需要特别关注OpenClaw的安全配置？ 去年夏天，我在调试一个自动整理文档的OpenClaw任务时，不小心让AI助手误删了工作目录下的重要文件。这次经历让我深刻意识到&am…...

编程新知 2026/4/5 18:44:34

5种突破方案：非Steam游戏创意工坊模组获取终极指南

5种突破方案：非Steam游戏创意工坊模组获取终极指南【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 一、问题定位：非Steam玩家的创意工坊访问困境 1.1 核…...

编程新知 2026/4/5 18:01:41

互联网时代出现过的电脑病毒之“小球病毒”也叫“乒乓病毒”的电脑和安卓手机上出现过的病毒“乒乓病毒”简介

（转发需官方授权） 互联网时代出现过的电脑病毒之“小球病毒”也叫“乒乓病毒”的电脑和安卓手机上出现过的病毒“乒乓病毒”简介 1989年4月，西南铝厂一台正在工作的计算机屏幕上突然跳出一个小方块。 1989年4月，西南铝厂一…...

编程新知 2026/4/5 17:11:16

Pandoc 格式转换引擎：2025年3大突破性更新

Pandoc 格式转换引擎：2025年3大突破性更新【免费下载链接】pandoc Universal markup converter 项目地址: https://gitcode.com/gh_mirrors/pa/pandoc 在数字化文档处理领域，格式转换的痛点长期困扰着专业人士。医疗行业报告显示，67.…...

编程新知 2026/4/5 15:44:14

【xinference】（15）：在compshare上，使用docker-compose运行xinference和chatgpt-web项目，配置成功！！！

视频演示

1，安装docker方法：

2，然后就可以启动docker-compose了

3，启动成功之后就访问了

相关文章：

【xinference】（15）：在compshare上，使用docker-compose运行xinference和chatgpt-web项目，配置成功！！！

【Unity 3D角色移动】

个人视角，社会影响力：自媒体的魅力所在

算法训练营day70

EtherCAT转Profinet网关配置说明第二讲：上位机软件配置

日志自动分析-Web---360星图GoaccessALBAnolog

【面试八股文】java基础知识

ssrf结合redis未授权getshell

魔法自如：精通 IPython %automagic 命令的切换艺术

基于CentOS Stream 9平台搭建MinIO以及开机自启

shell-awk语法整理

关于忠诚：忠于自己的良知、理想、信念

探索Linux：开源世界的无限可能

深度学习之半监督学习：一文梳理目标检测中的半监督学习策略

Hive 高可用分布式部署详细步骤

ubuntu下运行程序时提示缺库问题的有效解决方法

GNU/Linux - wic文件的使用

前端JS 插件实现下载【js-tool-big-box，下载大文件（fetch请求 + 下载功能版）

JVM专题之垃圾收集器

SSM养老院管理系统-计算机毕业设计源码02221

KL46Z电容触摸驱动库：TSI传感器适配与抗干扰实践

从“馒头波”到正弦波：深入理解PFC如何拯救你的电源功率因数

SpringCloud快速入门--GateWay路由网关与Config配置中心

2026最权威的十大降AI率平台实测分析

2026届毕业生推荐的AI学术工具实测分析

Linux进程信号详解（二）：信号产生

OpenClaw安全配置指南：Qwen3-14b_int4_awq模型权限管理

5种突破方案：非Steam游戏创意工坊模组获取终极指南

互联网时代出现过的电脑病毒之“小球病毒”也叫“乒乓病毒”的电脑和安卓手机上出现过的病毒“乒乓病毒”简介

Pandoc 格式转换引擎：2025年3大突破性更新