当前位置: 首页 > news >正文

AI智算-k8s部署DeepSeek Janus-Pro-7B 多模态大模型

文章目录

      • 简介
      • 环境依赖
      • 模型下载
      • 下载Janus库
      • GPU环境镜像
      • 模型manifest
      • 调用Janus
        • 多模态
        • 文生图

简介

DeepSeek Janus Pro 作为一款强大的多模态理解与生成框架,正在成为研究人员和开发者的热门选择。本文将详细介绍如何在云原生k8s环境中部署配置和使用 DeepSeek Janus Pro,以及它在多模态任务中的强大功能。

环境依赖

Kubernetes、GPU(H100)

模型下载

参考链接:https://www.modelscope.cn/models/deepseek-ai/Janus-Pro-7B/files

modelscope download --model deepseek-ai/Janus-Pro-7B --local_dir file_CPU_01/modelServing/Janus-Pro-7B/

下载Janus库

git clone  https://github.com/deepseek-ai/Janus.git

GPU环境镜像

modelscope-registry.cn-beijing.cr.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.1.0-py310-torch2.3.1-tf2.16.1-1.22.2

模型manifest

cat Janus-Pro.yaml 
kind: Deployment
apiVersion: apps/v1
metadata:name: janusprolabels:app: januspro
spec:replicas: 1selector:matchLabels:app: janusprotemplate:metadata:labels:app: janusprospec:schedulerName: volcanovolumes:- name: shmemptyDir:medium: MemorysizeLimit: 512G- name: host-timehostPath:path: /etc/localtimetype: ''- name: model-volumehostPath:path: /file_CPU_01/modelServing/Janus-Pro-7B/type: ''containers:- name: janusproimage: modelscope-registry.cn-beijing.cr.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.1.0-py310-torch2.3.1-tf2.16.1-1.22.2command: ["/bin/bash", "-c"]args: ["/modelscope_cache/startup.sh"]ports:- name: http-8000containerPort: 8000protocol: TCPenv:- name: MODELSCOPE_CACHEvalue: "/modelscope_cache"resources:limits:nvidia.com/gpu: '8'requests:nvidia.com/gpu: '8'volumeMounts:- name: host-timereadOnly: truemountPath: /etc/localtime- name: shmmountPath: /dev/shm- name: model-volumemountPath: /modelscope_cacheimagePullPolicy: IfNotPresentrestartPolicy: Always
---
kind: Service
apiVersion: v1
metadata:name: janusprolabels:app: januspro
spec:ports:- name: http-7860protocol: TCPport: 7860targetPort: 7860selector:app: janusprotype: NodePort
###模型启动脚本###
cat startup.sh 
#!/bin/bash
# startup.sh# 复制文件
cp /modelscope_cache/Janus-main/frpc_linux_amd64_v0.3 /usr/local/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.3# 安装依赖
echo "Installing dependencies..."
cd /modelscope_cache/Janus-main
pip install -e . # 启动
python demo/app_januspro.py --device cuda

调用Janus

kubectl get svc -n sre-tools 
NAME                 TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)           AGE
januspro             NodePort    10.233.38.3     <none>        7860:31456/TCP    3h52m

用宿主机$ip:31456 访问即可

多模态

在这里插入图片描述

文生图

在这里插入图片描述
在这里插入图片描述

PS:
ModelScope server无法直接加载本地下载好的Janus-Pro模型

相关文章:

AI智算-k8s部署DeepSeek Janus-Pro-7B 多模态大模型

文章目录 简介环境依赖模型下载下载Janus库GPU环境镜像模型manifest调用Janus多模态文生图 简介 DeepSeek Janus Pro 作为一款强大的多模态理解与生成框架&#xff0c;正在成为研究人员和开发者的热门选择。本文将详细介绍如何在云原生k8s环境中部署配置和使用 DeepSeek Janus…...

【截图】selenium自动通过浏览器截取指定元素div的图片

【截图】selenium自动通过浏览器截取指定元素div的图片 思路 截取完整网页截图 通过元素的坐标 截图到指定位置的图片 前提是已经获取到 driver 了 # 定位目标divtarget_div driver.find_element(By.CLASS_NAME, headlines-right)# 获取div的位置和大小location target_div…...

如何导入第三方sdk | 引入第三方jar 包

0. 背景1. 上传私有仓库2. 使用本地文件系统 0. 背景 对接一些第三方功能&#xff0c;会拿到第三方的sdk&#xff0c;也就是jar包&#xff0c;如何导入呢 1. 上传私有仓库 最好的方式就是将第三方jar包&#xff0c;上传到私有的仓库&#xff0c;这样直接正常在pom引用即可如果只…...

HarmonyOS 5.0应用开发——ContentSlot的使用

【高心星出品】 文章目录 ContentSlot的使用使用方法案例运行结果 完整代码 ContentSlot的使用 用于渲染并管理Native层使用C-API创建的组件同时也支持ArkTS创建的NodeContent对象。 支持混合模式开发&#xff0c;当容器是ArkTS组件&#xff0c;子组件在Native侧创建时&#…...

C#常用集合优缺点对比

先上结论&#xff1a; 在C#中&#xff0c;链表、一维数组、字典、List<T>和ArrayList是常见的数据集合类型&#xff0c;它们各有优缺点&#xff0c;适用于不同的场景。以下是它们的比较&#xff1a; 1. 一维数组 (T[]) 优点&#xff1a; 性能高&#xff1a;数组在内存中…...

基于CLIP视觉语言大模型的行人重识别方法的简单框架设计

以下是一个基于CLIP视觉语言大模型的行人重识别方法的简单框架设计&#xff0c;用于数据集测试。我们将使用torch和clip库&#xff0c;假设数据集是一个包含行人图像的文件夹结构&#xff0c;每个子文件夹代表一个行人身份。 步骤概述 安装必要的库加载CLIP模型定义数据集类提…...

RabbitMQ 从入门到精通:从工作模式到集群部署实战(三)

文章目录 使用CLI管理RabbitMQrabbitmqctlrabbitmq-queuesrabbitmq-diagnosticsrabbitmq-pluginsrabbitmq-streamsrabbitmq-upgraderabbitmqadmin 使用CLI管理RabbitMQ RabbitMQ CLI 工具需要安装兼容的 Erlang/OTP版本。 这些工具假定系统区域设置为 UTF-8&#xff08;例如en…...

BurpSuite抓包与HTTP基础

文章目录 前言一、BurpSuite1.BurpSuite简介2.BurpSuite安装教程(1)BurpSuite安装与激活(2)安装 https 证书 3.BurpSuite使用4.BurpSuite资料 二、图解HTTP1.HTTP基础知识2.HTTP客户端请求消息3.HTTP服务端响应消息4.HTTP部分请求方法理解5.HTTPS与HTTP 总结 前言 在网络安全和…...

SQL Server 数据库迁移到 MySQL 的完整指南

文章目录 引言一、迁移前的准备工作1.1 确定迁移范围1.2 评估兼容性1.3 备份数据 二、迁移工具的选择2.1 使用 MySQL Workbench2.2 使用第三方工具2.3 手动迁移 三、迁移步骤3.1 导出 SQL Server 数据库结构3.2 转换数据类型和语法3.3 导入 MySQL 数据库3.4 迁移数据3.5 迁移存…...

【大模型】DeepSeek与chatGPT的区别以及自身的优势

目录 一、前言二、核心技术对比2.1 模型架构设计2.1.1 ChatGPT的Transformer架构2.1.2 DeepSeek的混合架构 2.2 训练数据体系2.2.1 ChatGPT的数据特征2.2.2 DeepSeek的数据策略 三、应用场景对比3.1 通用场景表现3.1.1 ChatGPT的强项领域3.2.2 DeepSeek的专项突破 3.3 响应效率…...

DeepSeek:知识图谱与大模型参数化知识融合的创新架构

引言&#xff1a;AI 领域的融合趋势 在目前大模型与知识图谱作为两个重要的研究方向&#xff0c;各自展现出了强大的能力与潜力。大模型&#xff0c;凭借其在海量数据上的深度训练&#xff0c;拥有强大的语言理解与生成能力&#xff0c;能够处理多种自然语言处理任务&#xff0…...

ES6 迭代器 (`Iterator`)使用总结

Iterator&#xff08;迭代器&#xff09;是 ES6 引入的一种 接口&#xff0c;用于 顺序访问 可迭代对象&#xff08;Array、Set、Map、String、arguments、自定义对象等&#xff09;。 Iterator&#xff08;迭代器&#xff09;的作用有三个&#xff1a; 为各种数据结构提供一个…...

信用修复和失联修复的区别

失联修复和信用修复是两个不同的概念&#xff0c;在目的、操作方式和应用场景上都有所区别。 失联修复 失联修复主要是指在金融催收行业中&#xff0c;当债务人的联系方式&#xff08;通常是手机号码&#xff09;发生改变&#xff0c;导致无法联系到债务人时&#xff0c;催收公…...

2025蓝桥杯JAVA编程题练习Day3

1.黛玉泡茶【算法赛】 问题描述 话说林黛玉闲来无事&#xff0c;打算在潇湘馆摆个茶局&#xff0c;邀上宝钗、探春她们一起品茗赏花。黛玉素来讲究&#xff0c;用的茶杯也各有不同&#xff0c;大的小的&#xff0c;高的矮的&#xff0c;煞是好看。这不&#xff0c;她从柜子里…...

[论文阅读] Knowledge Fusion of Large Language Models

Knowledge Fusion of Large Language Models (FuseLLM) Methodology 整体Pipeline如下图所示 不同的动物代表不同的LLM。左边第一&#xff0c;第二分别是Ensemble以及Weight Merging方法。最右侧为本文提出的FuseLLM。 Ensemble: 融合多个models的预测结果&#xff0c;比如…...

deepseek来讲lua

Lua 是一种轻量级、高效、可嵌入的脚本语言&#xff0c;广泛应用于游戏开发、嵌入式系统、Web 服务器等领域。以下是 Lua 的主要特点和一些基本概念&#xff1a; 1. 特点 轻量级&#xff1a;Lua 的核心非常小&#xff0c;适合嵌入到其他应用程序中。高效&#xff1a;Lua 的执…...

探索 Spring Cloud Alibaba:开启微服务架构新时代

一、引言 在当今数字化浪潮中&#xff0c;软件系统的规模和复杂度不断攀升&#xff0c;传统的单体架构逐渐难以满足快速迭代、高并发处理以及灵活扩展的需求。微服务架构应运而生&#xff0c;它将一个大型的应用拆分成多个小型、自治的服务&#xff0c;每个服务专注于特定的业务…...

【数据结构】(6) LinkedList 链表

一、什么是链表 1、链表与顺序表对比 不同点LinkedListArrayList物理存储上不连续连续随机访问效率O(N)O(1&#xff09;插入、删除效率O(1)O(N) 3、链表的分类 链表根据结构分类&#xff0c;可分为单向/双向、无头结点/有头节点、非循环/循环链表&#xff0c;这三组每组各取…...

【工具变量】上市公司企业渐进式创新程度及渐进式创新锁定数据(1991-2023年)

测算方式&#xff1a; 参考顶刊《经济研究》孙雅慧&#xff08;2024&#xff09;老师的做法&#xff0c;用当期创新和往期创新的内容重叠度作为衡量渐进式创新程度的合理指标。通过搜集海量专利摘要&#xff0c;测算当前专利申请和既有专利的内容相似度&#xff0c;反映企业在…...

07_任务状态——改进播放控制

一、声明 在05和06的程序里面可以达到的一个效果就是很完美的播放音乐&#xff0c;并且不会影响到其它任务的运行&#xff0c;但是这个代码有一个弊端就是要么创建任务从头开始播放要么就直接删除任务。 我们现在的程序就增加了音乐的暂停和恢复的功能&#xff0c;那么能够达到…...

VTube Studio终极指南:30分钟快速打造专业虚拟主播形象

VTube Studio终极指南&#xff1a;30分钟快速打造专业虚拟主播形象 【免费下载链接】VTubeStudio VTube Studio API Development Page 项目地址: https://gitcode.com/gh_mirrors/vt/VTubeStudio 想要开启虚拟主播之旅&#xff0c;却被复杂的技术门槛吓退&#xff1f;VT…...

树莓派Zero无音频接口?PWM+RC滤波实现模拟音频输出全攻略

1. 项目概述与核心思路树莓派Zero以其极致的性价比和紧凑的尺寸&#xff0c;在创客和嵌入式开发者中备受欢迎。然而&#xff0c;为了将成本和体积压缩到极致&#xff0c;树莓派基金会做出了一个“艰难的决定”&#xff1a;移除了标准型号上常见的3.5mm音频接口&#xff0c;也没…...

基于smartcat的智能文件自动分类与归档系统实践

1. 项目概述&#xff1a;一个智能化的文件分类与归档工具最近在整理个人电脑和服务器上的文件时&#xff0c;我又一次陷入了混乱。下载文件夹里混杂着PDF、图片、代码压缩包、安装程序&#xff1b;项目文档和历史备份散落在各处。手动分类不仅耗时&#xff0c;而且容易出错。我…...

SIM800C模块硬件连接避坑指南:从USB-TTL调试到STM32F407实战接线

SIM800C模块硬件连接避坑指南&#xff1a;从USB-TTL调试到STM32F407实战接线 在嵌入式开发中&#xff0c;GSM模块的硬件连接往往是项目成功的第一步&#xff0c;也是最容易踩坑的环节。SIM800C作为一款经典的工业级GSM/GPRS模块&#xff0c;其稳定性和性价比备受开发者青睐&…...

AI编码工作流:工程化实践框架与团队效能提升

1. 项目概述&#xff1a;从“AI编码工作流”说起最近在GitHub上看到一个挺有意思的项目&#xff0c;叫nicksp/ai-coding-workflow。光看这个名字&#xff0c;可能很多朋友会想&#xff0c;这不就是又一个教你怎么用ChatGPT或者Copilot写代码的教程吗&#xff1f;说实话&#xf…...

MATLAB集成大语言模型:架构设计与工程实践指南

1. 项目概述&#xff1a;当MATLAB遇见大语言模型如果你和我一样&#xff0c;是个长期泡在MATLAB环境里的工程师或研究员&#xff0c;面对这两年大语言模型&#xff08;LLM&#xff09;的狂潮&#xff0c;心里可能既兴奋又有点“隔岸观火”的疏离感。我们习惯了用MATLAB处理矩阵…...

awesome-clothed-human安全指南:在数字人体建模中保护用户隐私的5个最佳实践

awesome-clothed-human安全指南&#xff1a;在数字人体建模中保护用户隐私的5个最佳实践 【免费下载链接】awesome-digital-human Digital Human Resource: 2D/3D/4D Human Modeling, Avatar Generation & Animation, Clothed People Digitalization, Virtual Try-On, etc.…...

Go语言工厂模式:对象创建封装

Go语言工厂模式&#xff1a;对象创建封装 1. 简单工厂 type Product interface {Operation() string }type ConcreteProductA struct{}func (p *ConcreteProductA) Operation() string {return "Product A" }type ConcreteProductB struct{}func (p *ConcreteProduct…...

性能巨兽:基于AMD EPYC 9755与RTX 5090D的UltraLAB GA660M仿真工作站深度解析

在高端制造、能源勘探和前沿科学计算领域&#xff0c;算力永远是稀缺资源。每一次CPU与GPU的代际更迭&#xff0c;都意味着仿真效率的指数级提升。今天&#xff0c;我们解析的这款UltraLAB GA660M241256-MBD工作站&#xff0c;正是集成了2026年顶级硬件技术的算力平台。它不仅是…...

别再手动输数据了!手把手教你用Fluent的Profile功能导入实验数据(附CSV文件模板)

别再手动输数据了&#xff01;手把手教你用Fluent的Profile功能导入实验数据&#xff08;附CSV文件模板&#xff09; 在计算流体力学&#xff08;CFD&#xff09;分析中&#xff0c;准确导入实验数据或第三方软件的计算结果作为边界条件&#xff0c;往往是确保仿真可靠性的关键…...