当前位置：首页 > news >正文

浅谈人工智能之基于容器云进行图生视频大模型搭建

news 2026/2/9 12:01:09

浅谈人工智能之基于容器云进行图生视频大模型搭建

根据之前我们所讲过的内容：
文生图
文生视频
我们继续讲解图生视频大模型搭建。

引言

随着深度学习技术的不断发展，图生视频（image-to-video）大模型成为了计算机视觉和自然语言处理领域的一个研究热点。图生视频模型可以根据输入的文本描述生成高质量的视频，广泛应用于艺术创作、广告设计、虚拟现实等领域。本文将介绍如何搭建一个基于iic/Image-to-Video的文生视频大模型。

模型效果展示

我们首先看一下我们对搭建好的模型的效果进行展示，我们输入的图片如下：
在这里插入图片描述 ## 环境搭建
基于上一篇文生图的模型搭建，我们进行文生视频的搭建。
第一步：依赖安装

pip install modelscope==1.8.4
pip install xformers==0.0.20
pip install torch==2.0.1
pip install open_clip_torch>=2.0.2
pip install opencv-python-headless
pip install opencv-python 
pip install einops>=0.4
pip install rotary-embedding-torch
pip install fairscale 
pip install scipy
pip install imageio
pip install pytorch-lightning
pip install torchsde

第二步：模型下载调用

from modelscope.pipelines import pipeline
from modelscope.outputs import OutputKeyspipe = pipeline(task="image-to-video", model='damo/Image-to-Video', model_revision='v1.1.0', device='cuda:0')# IMG_PATH: your image path (url or local file)
output_video_path = pipe("/root/image.jpg", output_video='./output.mp4')[OutputKeys.OUTPUT_VIDEO]
print(output_video_path)

第三步：大概率情况下会提示没有安装ffmpeg提示

2024-11-26 17:10:12,990 - modelscope - ERROR - Save Video Error with /bin/sh: 1: ffmpeg: not found
2024-11-26 17:10:12,996 - modelscope - WARNING - task image-to-video output keys are missing

第四步：安装ffmpeg

sudo apt update
sudo apt install ffmpeg

第五步：再次跑py脚本，我就可以获得对应的输出视频了，如果上述跑脚本的时候提示缺少对应依赖，根据提示信息再对对应依赖进行安装部署。

浅谈人工智能之基于容器云进行图生视频大模型搭建

浅谈人工智能之基于容器云进行图生视频大模型搭建根据之前我们所讲过的内容： 文生图文生视频我们继续讲解图生视频大模型搭建。引言随着深度学习技术的不断发展，图生视频（image-to-video）大模型成为了计算机视觉和自然语言…...

编程日记 2024/12/1 8:48:07

大型复杂项目管理怎么结合传统与敏捷

大型复杂项目管理需要综合运用传统的瀑布模型与敏捷方法，两者各具优势，可以在不同的项目阶段和需求下发挥最大效能。首先，在项目的初期阶段，传统方法的详细规划和需求分析能够帮助确保项目方向正确、资源充足；敏捷方法…...

编程日记 2024/12/1 8:47:06

家校通小程序实战教程04教师管理

目录 1 创建数据源2 搭建管理后台3 搭建查询条件4 功能测试总结我们上一篇介绍了如何将学生加入班级，学生加入之后就需要教师加入了。教师分为任课老师和班主任，班主任相当于一个班级的管理员，日常可以发布各种任务，发布接龙&…...

编程日记 2024/12/1 8:46:05

UI控件使用说明

文章目录一、控件的公共属性二、常用控件的私有属性三、控件的显示与隐藏一、控件的公共属性 struct element {u32 highlight: 1; //高亮标志u32 state: 3; //内核记录控件的状态u32 ref: 5; //内核计数值u32 prj: 3; //工程序号u32 hide_action: 1; //HIDE_WI…...

编程日记 2024/12/1 8:43:02

树莓派2安装jupyterlab以便更好的编程体验

树莓派2 是一款很老的开发板了，但是它还能继续战斗。为了更好的编程体验，准备安装jupyterlab 安装jupyterlab 使用命令： pip install jupyterlab 该过程非常漫长，因为树莓派2是很老的板子，它需要安装一些arm7版本的…...

编程日记 2024/12/1 8:42:01

计算机网络常见面试题总结(上)

计算机网络基础网络分层模型 OSI 七层模型是什么？每一层的作用是什么？ OSI 七层模型是国际标准化组织提出的一个网络分层模型，其大体结构以及每一层提供的功能如下图所示： 每一层都专注做一件事情，并且每一层都需…...

编程日记 2024/12/1 8:41:00

k8s 亲和性之Affinity

文章目录 1. Node Affinity（节点亲和性）节点亲和性类型配置示例常见场景： 2. Pod Affinity 和 Pod Anti-AffinityPod Affinity 配置示例Pod Anti-Affinity 配置示例常见场景： 3. 亲和性规则概述4. 亲和性和反亲和性的细节5. 亲和性…...

编程日记 2024/12/1 8:38:59

SpringBoot 插件化开发模式

一、前言 1.1 使用插件的好处 1.1.1 模块解耦实现服务模块之间解耦的方式有很多，但是插件来说，其解耦的程度似乎更高，而且更灵活，可定制化、个性化更好。举例来说，代码中可以使用设计模式来选择使用哪种方式发送…...

编程日记 2024/12/1 8:37:58

基于树莓派的安保巡逻机器人--项目介绍

目录一、项目简介二、项目背景三、作品研发技术方案作品主要内容： 方案的科学性设计的合理性四、作品创新性及特点五、作品自我评价本篇为项目“基于树莓派的安保巡逻机器人”介绍博客演示视频链接： 基于树莓派的安保巡逻机器人_音游…...

编程日记 2024/12/1 8:36:57

Python学习笔记8-函数1

自定义函数 def 函数名(形参):函数体return 空/变量/对象/表达式形参：函数定义时声明的参数实参：函数调用时传入的参数。函数只需要定义一次，就可以被多次使用当函数被调用时，才执行函数体，定义时不执行文档注释 …...

编程日记 2024/12/1 8:34:55

如何使用ST7789展现图片？[ESP--4]

本节我们继续ESP和ST 7789的话题，这节课我们来学学如何展示图片,话不多说，先上效果好，教程开始~前情提要，要看懂这篇，建议搭配楼主的前两期文章使用ESP32驱动LCD-ST7789屏幕[ESP–2] 加速你的LCD-ST7789屏幕&#xf…...

编程日记 2024/12/1 8:33:53

【QNX+Android虚拟化方案】129 - USB眼图参数配置

【QNX+Android虚拟化方案】129 - USB眼图参数配置 1. 软件侧dts如何配置眼图参数及其对应关系2. 硬件 QNX 侧调试眼图命令2.1 High Speed USB2.0 Host2.2 Super Speed USB3.0 Host3. 硬件 Android 侧调试眼图命令基于原生纯净代码，自学总结纯技术分享，不会也不敢涉项目、不…...

编程日记 2024/12/1 8:31:51

【机器学习】探索机器学习决策树算法的奥秘

决策树前言基本概念常见的决策树算法ID3算法C4.5算法CART算法决策树的优缺点应用场景决策树的可视化总结前言在当今这个数据驱动的时代，机器学习作为数据分析与预测的利器，正以前所未有的速度改变着我们的生活和工作方式。在众多机器学习算法中&…...

编程日记 2024/12/1 8:29:49

K8S版本和istio版本的对照关系

版本对照关系下载地址1 下载地址2...

编程日记 2024/12/1 8:28:48

嵌入式硬件实战提升篇(三)商用量产电源设计方案三路电源输入设计电源管理多输入供电自动管理 DCDC降压

引言：本文你能实际的了解到实战量产产品中电源架构设计的要求和过程，并且从实际实践出发搞懂电源架构系统，你也可以模仿此架构抄板到你自己的项目，并结合硬件篇之前的项目以及理论形成正真的三路电源输入设计与开发板电源架构块供…...

编程日记 2024/12/1 8:25:44

【机器学习】机器学习的基本分类-监督学习-逻辑回归-Sigmoid 函数

Sigmoid 函数是一种常用的激活函数，尤其在神经网络和逻辑回归中扮演重要角色。它将输入的实数映射到区间 (0, 1)，形状类似于字母 "S"。 1. 定义与公式 Sigmoid 函数的公式为： 特点输出范围：(0, 1)，适合用…...

编程日记 2024/12/1 8:23:42

EasyDarwin搭建直播推流服务

学习链接 easydarwin官网 - 这里看介绍 easydarwin软件下载地址 - 百度网盘 easydarwin视频 B站文章目录学习链接使用下载EasyDarwin压缩包，并解压到目录启动EasyDarwin点播直播easyplayer.jsapidocffmpeg推流rtsp & ffplay拉流使用下载EasyDarwin压缩包…...

编程日记 2024/12/1 8:19:38

无人机数据处理系统:原理与核心系统

一、数据处理系统的运行原理数据获取：无人机在飞行过程中，通过搭载的传感器（如相机、激光雷达等）采集到各种类型的数据，例如图像、点云等。这些数据是后续处理和分析的基础。数据传输：采集到的数据会通…...

编程日记 2024/12/1 8:18:35

DLL中的inline static成员变量：Windows开发中的常见陷阱

在Windows平台进行C开发时，DLL（动态链接库）是一个非常重要的概念。它让我们能够实现代码的模块化和动态加载，提高了程序的灵活性和维护性。然而，当我们在DLL中使用C17引入的inline static成员变量时，可能会…...

编程日记 2024/12/1 8:16:33

pandas 读写excel

在Python中，使用Pandas库读写Excel文件是一个常见的操作。Pandas提供了read_excel和to_excel方法来分别实现读取和写入Excel文件的功能。以下是一些基本的示例： ### 读取Excel文件 python import pandas as pd # 读取Excel文件 df pd.read_excel(pat…...

编程日记 2024/12/1 8:15:33

测试微信模版消息推送

进入“开发接口管理”--“公众平台测试账号”，无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。获取access_token: 自定义模版消息： 关注测试号：扫二维码关注测试号。发送模版消息： import requests da…...

编程新知 2026/2/8 4:37:13

剑指offer20_链表中环的入口节点

链表中环的入口节点给定一个链表，若其中包含环，则输出环的入口节点。若其中不包含环，则输出null。数据范围节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。节点 val 值各不相同。链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

编程新知 2026/1/31 6:09:22

[10-3]软件I2C读写MPU6050 江协科技学习笔记（16个知识点）

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16...

编程新知 2026/1/28 8:34:48

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...

编程新知 2025/11/26 13:15:57

GitHub 趋势日报 (2025年06月08日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图今日获星趋势图 884 cognee 566 dify 414 HumanSystemOptimization 414 omni-tools 321 note-gen …...

编程新知 2025/12/13 1:32:15

【论文阅读28】-CNN-BiLSTM-Attention-（2024）

本文把滑坡位移序列拆开、筛优质因子，再用 CNN-BiLSTM-Attention 来动态预测每个子序列，最后重构出总位移，预测效果超越传统模型。文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵（S…...

编程新知 2026/2/2 3:06:53

如何在最短时间内提升打ctf（web)的水平？

刚刚刷完2遍 bugku 的 web 题，前来答题。每个人对刷题理解是不同，有的人是看了writeup就等于刷了，有的人是收藏了writeup就等于刷了，有的人是跟着writeup做了一遍就等于刷了，还有的人是独立思考做了一遍就等于刷了。…...

编程新知 2026/1/28 5:55:15

Element Plus 表单(el-form)中关于正整数输入的校验规则

目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入（联动）2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...

编程新知 2025/11/10 19:08:45

python执行测试用例，allure报乱码且未成功生成报告

allure执行测试用例时显示乱码：‘allure’ �����ڲ����ⲿ���Ҳ���ǿ�&am…...

编程新知 2026/2/7 4:21:44

docker 部署发现spring.profiles.active 问题

报错： org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

编程新知 2025/9/20 12:14:18

浅谈人工智能之基于容器云进行图生视频大模型搭建

引言

模型效果展示

相关文章：