当前位置：首页 > article >正文

【字节拥抱开源】字节团队开源视频模型 ContentV: 有限算力下的视频生成模型高效训练

article 2026/5/26 6:15:54

本项目提出了ContentV框架，通过三项关键创新高效加速基于DiT的视频生成模型训练：

极简架构设计，最大化复用预训练图像生成模型进行视频合成
系统化的多阶段训练策略，利用流匹配技术提升效率
经济高效的人类反馈强化学习框架，无需额外人工标注即可提升生成质量

我们开源的80亿参数模型（基于Stable Diffusion 3.5 Large和Wan-VAE）仅用4周时间在256×64GB NPU上训练，就取得了VBench评测85.14分的业界最佳成绩。

在这里插入图片描述

⚡ 快速开始

安装步骤

git clone https://github.com/bytedance/ContentV.git
cd ContentV
pip3 install -r requirements.txt

文生视频

## For GPU
python3 demo.py
## For NPU
USE_ASCEND_NPU=1 python3 demo.py

24GB消费级显卡可以使用，建议开启model offload。

📊 VBench

Model	Total Score	Quality Score	Semantic Score	Human Action	Scene	Dynamic Degree	Multiple Objects	Appear. Style
Wan2.1-14B	86.22	86.67	84.44	99.20	61.24	94.26	86.59	21.59
ContentV (Long)	85.14	86.64	79.12	96.80	57.38	83.05	71.41	23.02
Goku†	84.85	85.60	81.87	97.60	57.08	76.11	79.48	23.08
Open-Sora 2.0	84.34	85.40	80.12	95.40	52.71	71.39	77.72	22.98
Sora†	84.28	85.51	79.35	98.20	56.95	79.91	70.85	24.76
ContentV (Short)	84.11	86.23	75.61	89.60	44.02	79.26	74.58	21.21
EasyAnimate 5.1	83.42	85.03	77.01	95.60	54.31	57.15	66.85	23.06
Kling 1.6†	83.40	85.00	76.99	96.20	55.57	62.22	63.99	20.75
HunyuanVideo	83.24	85.09	75.82	94.40	53.88	70.83	68.55	19.80
CogVideoX-5B	81.61	82.75	77.04	99.40	53.20	70.97	62.11	24.91
Pika-1.0†	80.69	82.92	71.77	86.20	49.83	47.50	43.08	22.26
VideoCrafter-2.0	80.44	82.20	73.42	95.00	55.29	42.50	40.66	25.13
AnimateDiff-V2	80.27	82.90	69.75	92.60	50.19	40.83	36.88	22.42
OpenSora 1.2	79.23	80.71	73.30	85.80	42.47	47.22	58.41	23.89

❤️ 感谢

Stable Diffusion 3.5 Large
Wan2.1
Diffusers
HuggingFace

【字节拥抱开源】字节团队开源视频模型 ContentV: 有限算力下的视频生成模型高效训练

本项目提出了ContentV框架，通过三项关键创新高效加速基于DiT的视频生成模型训练： 极简架构设计，最大化复用预训练图像生成模型进行视频合成系统化的多阶段训练策略，利用流匹配技术提升效率经济高效的人类反馈强化学习框架&#x…...

编程日记 2026/5/22 21:16:40

本地部署drawDB结合内网穿透技术实现数据库远程管控方案

文章目录前言1. Windows本地部署DrawDB2. 安装Cpolar内网穿透3. 实现公网访问DrawDB4. 固定DrawDB公网地址前言在数字化浪潮席卷全球的背景下，数据治理能力正日益成为构建现代企业核心竞争力的关键因素。无论是全球500强企业的数据中枢系统，还是初创…...

编程日记 2026/5/14 2:54:43

可视化预警系统：如何实现生产风险的实时监控？

在生产环境中，风险无处不在，而传统的监控方式往往只能事后补救，难以做到提前预警。但如今，可视化预警系统正在改变这一切！它能够实时收集和分析生产数据，通过直观的图表和警报，让管理者第一时间…...

编程日记 2026/5/20 4:32:08

Assessing Modality Bias in Video Question Answering Benchmarks with Multimodal Large Language Models ➡️ 论文标题：Assessing Modality Bias in Video Question Answering Benchmarks with Multimodal Large Language Models ➡️ 论文作者：Jea…...

编程日记 2026/5/17 8:02:38

【向量库】Weaviate概述与架构解析

文章目录一、什么是weaviate二、High-Level Architecture1. Core Components2. Storage Layer3. 组件交互流程三、核心组件1. API Layer2. Schema Management3. Vector Indexing3.1. 查询原理3.2. 左侧：Search Process（搜索流程）3.3. 右侧&…...

编程日记 2026/5/25 21:49:22

PostgreSQL 对 IPv6 的支持情况

PostgreSQL 对 IPv6 的支持情况 PostgreSQL 全面支持 IPv6 网络协议，包括连接、存储和操作 IPv6 地址。以下是详细说明： 一、网络连接支持 1. 监听 IPv6 连接在 postgresql.conf 中配置： listen_addresses 0.0.0.0,:: # 监听所有IPv4…...

编程日记 2026/3/5 21:48:50

python数据结构和算法(1)

数据结构和算法简介数据结构：存储和组织数据的方式，决定了数据的存储方式和访问方式。算法：解决问题的思维、步骤和方法。程序数据结构算法算法算法的独立性算法是独立存在的一种解决问题的方法和思想，对于算法而言&a…...

编程日记 2026/2/18 18:36:59

视觉slam--框架

视觉里程计的框架传感器 VO--front end VO的缺点后端--back end 后端对什么数据进行优化利用什么数据进行优化的后端是怎么进行优化的回环检测建图建图是指构建地图的过程。构建的地图是点云地图还是什么信息的地图？ 建图并没有一个固定的形式和算法…...

编程日记 2026/4/2 9:57:00

统计按位或能得到最大值的子集数目

我们先来看题目描述： 给你一个整数数组 nums ，请你找出 nums 子集按位或可能得到的最大值 ，并返回按位或能得到最大值的不同非空子集的数目。如果数组 a 可以由数组 b 删除一些元素（或不删除）得到，…...

编程日记 2026/5/14 2:54:43

npm install 相关命令

npm install 相关命令基本安装命令 # 安装 package.json 中列出的所有依赖 npm install npm i # 简写形式# 安装特定包 npm install <package-name># 安装特定版本 npm install <package-name><version>依赖类型选项 # 安装为生产依赖（默认&…...

编程日记 2026/2/16 23:14:18

Spring Boot 与 Kafka 的深度集成实践（二）

3. 生产者实现 3.1 生产者配置在 Spring Boot 项目中，配置 Kafka 生产者主要是配置生产者工厂（ProducerFactory）和 KafkaTemplate 。生产者工厂负责创建 Kafka 生产者实例，而 KafkaTemplate 则是用于发送消息的核心组件&#x…...

编程日记 2026/2/22 12:23:35

【学习记录】使用 Kali Linux 与 Hashcat 进行 WiFi 安全分析：合法的安全测试指南

文章目录 📌 前言🧰 一、前期准备✅ 安装 Kali Linux✅ 获取支持监听模式的无线网卡 🛠 二、使用 Kali Linux 进行 WiFi 安全测试步骤 1：插入无线网卡并确认识别步骤 2：开启监听模式步骤 3：扫描附近的 WiFi…...

编程日记 2026/5/14 17:42:34

后端下载限速（redis记录实时并发，bucket4j动态限速）

✅ 使用 Redis 记录所有用户的实时并发下载数✅ 使用 Bucket4j 实现全局下载速率限制（动态）✅ 支持动态调整限速策略✅ 下载接口安全、稳定、可监控 🧩 整体架构概览模块功能Redis存储全局并发数和带宽令牌桶状态Bucket4j Redis分布式限…...

编程日记 2026/3/23 6:16:10

vue3 手动封装城市三级联动

要做的功能示意图是这样的，因为后端给的数据结构不足以使用ant-design组件的联动查询组件所以只能自己分装组件当然这个数据后端给的不一样的情况下可能组件内对应的逻辑方式就不一样毕竟是三个数组省份城市区域我直接粘贴组件代码了 <temp…...

编程日记 2026/5/23 22:11:35

Angular中Webpack与ngx-build-plus 浅学

Webpack 在 Angular 中的概念 Webpack 是一个模块打包工具，用于将多个模块和资源打包成一个或多个文件。在 Angular 项目中，Webpack 负责将 TypeScript、HTML、CSS 等文件打包成浏览器可以理解的 JavaScript 文件。Angular CLI 默认使用 Webpack 进行项目…...

编程日记 2026/3/7 15:08:43

大模型智能体核心技术：CoT与ReAct深度解析

**导读：**在当今AI技术快速发展的背景下，大模型的推理能力和可解释性成为业界关注的焦点。本文深入解析了两项核心技术：CoT（思维链）和ReAct（推理与行动），这两种方法正在重新定义大模…...

编程日记 2026/4/17 1:01:12

信息系统分析与设计复习

2024试卷单选题（20） 1、在一个聊天系统(类似ChatGPT)中，属于控制类的是（）。 A. 话语者类 B.聊天文字输入界面类 C. 聊天主题辨别类 D. 聊天历史类解析 B-C-E备选架构中分析类分为边界类、控制类和实体类。边界…...

编程日记 2026/3/5 12:54:55

Linux【5】-----编译和烧写Linux系统镜像（RK3568）

参考：讯为 1、文件系统不同的文件系统组成了：debian、ubuntu、buildroot、qt等系统每个文件系统的uboot和kernel是一样的 2、源码目录介绍目录 3、正式编译编译脚本build.sh 帮助内容如下： Available options: uboot …...

编程日记 2026/5/16 9:04:49

记一次spark在docker本地启动报错

1，背景在docker中部署spark服务和调用spark服务的微服务，微服务之间通过fegin调用 2，问题，docker容器中服务器来后，注册中心都有，调用服务也正常，但是调用spark启动任务后报错，报错…...

编程日记 2026/4/24 14:35:53

【向量库】Weaviate 搜索与索引技术：从基础概念到性能优化

文章目录零、概述一、搜索技术分类1. 向量搜索：捕捉语义的智能检索2. 关键字搜索：精确匹配的传统方案3. 混合搜索：语义与精确的双重保障二、向量检索技术分类1. HNSW索引：大规模数据的高效引擎2. Flat索引：小规模数据…...

编程日记 2026/4/19 18:35:21

ABB馈线保护 REJ601 BD446NN1XG

配电网基本量程数字继电器 REJ601是一种专用馈线保护继电器，用于保护一次和二次配电网络中的公用事业和工业电力系统。该继电器在一个单元中提供了保护和监控功能的优化组合，具有同类产品中最佳的性能和可用性。 REJ601是一种专用馈线保护继电器&#xf…...

编程日记 2026/2/26 0:26:26

Heygem50系显卡合成的视频声音杂音模糊解决方案

如果你在使用50系显卡有杂音的情况，可能还是官方适配问题，可以使用以下方案进行解决： 方案一：剪映替换音色（简单适合普通玩家） 使用剪映换音色即可，口型还是对上的，没有剪映vip的&…...

编程日记 2026/5/22 11:33:06

Gitlab + Jenkins 实现 CICD

CICD 是持续集成（Continuous Integration, CI）和持续交付/部署（Continuous Delivery/Deployment, CD）的缩写，是现代软件开发中的一种自动化流程实践。下面介绍 Web 项目如何在代码提交到 Gitlab 后，自动发布…...

编程日记 2026/5/23 12:09:49

无头浏览器技术：Python爬虫如何精准模拟搜索点击

1. 无头浏览器技术概述 1.1 什么是无头浏览器？ 无头浏览器是一种没有图形用户界面（GUI）的浏览器，它通过程序控制浏览器内核（如Chromium、Firefox）执行页面加载、JavaScript渲染、表单提交等操作。由于不渲…...

编程日记 2026/5/18 4:50:15

SDU棋界精灵——硬件程序ESP32实现opus编码

一、音频处理框架该项目基于Espressif的音频处理框架构建，核心组件包括 ESP-ADF 和 ESP-SR，以下是完整的音频处理框架实现细节： 1.核心组件 (1) 音频前端处理 (AFE - Audio Front-End) main/components/audio_pipeline/afe_processor.c功能：声学回声…...

编程日记 2026/5/24 12:34:32

Spring AI中使用ChatMemory实现会话记忆功能

文章目录 1、需求2、ChatMemory中消息的存储位置3、实现步骤1、引入依赖2、配置Spring AI3、配置chatmemory4、java层传递conversaionId 4、验证5、完整代码6、参考文档 1、需求我们知道大型语言模型 （LLM） 是无状态的，这就意味着他们不会保…...

编程日记 2026/5/20 4:25:33

Qt 按钮类控件（Push Button 与 Radio Button）（1）

文章目录 Push Button前提概要API接口给按钮添加图标给按钮添加快捷键 Radio ButtonAPI接口性别选择 Push Button（鼠标点击不放连续移动快捷键） Radio Button Push Button 前提概要 1. 之前文章中所提到的各种跟QWidget有关的各种属性/函数/方法&#…...

编程日记 2026/5/14 2:54:44

生成对抗网络（GAN）损失函数解读

GAN损失函数的形式： 以下是对每个部分的解读： 1. ⁡, ：这个部分表示生成器（Generator）G的目标是最小化损失函数。 ：判别器（Discriminator）D的目标是最大化损失函数。 GAN的训…...

编程日记 2026/5/23 3:20:43

汇编语言学习（三）——DoxBox中debug的使用

目录一、安装DoxBox，并下载汇编工具（MASM文件） 二、debug是什么三、debug中的命令一、安装DoxBox，并下载汇编工具（MASM文件） 链接： https://pan.baidu.com/s/1IbyJj-JIkl_oMOJmkKiaGQ?pw…...

编程日记 2026/5/24 15:21:04

【Java基础】向上转型（Upcasting）和向下转型（Downcasting）

在面向对象编程中，转型（Casting） 是指改变对象的引用类型，主要涉及继承关系和多态。向上转型（Upcasting） ⬆️ 定义将子类对象赋值给父类引用（自动完成，无需强制转换&…...

编程日记 2025/10/6 20:16:26

【字节拥抱开源】字节团队开源视频模型 ContentV: 有限算力下的视频生成模型高效训练

⚡ 快速开始

推荐PyTorch版本

安装步骤

📊 VBench

❤️ 感谢

相关文章：

【字节拥抱开源】字节团队开源视频模型 ContentV: 有限算力下的视频生成模型高效训练

本地部署drawDB结合内网穿透技术实现数据库远程管控方案

可视化预警系统：如何实现生产风险的实时监控？

多模态大语言模型arxiv论文略读（112）

【向量库】Weaviate概述与架构解析

PostgreSQL 对 IPv6 的支持情况

python数据结构和算法(1)

视觉slam--框架

统计按位或能得到最大值的子集数目

npm install 相关命令

Spring Boot 与 Kafka 的深度集成实践（二）

【学习记录】使用 Kali Linux 与 Hashcat 进行 WiFi 安全分析：合法的安全测试指南

后端下载限速（redis记录实时并发，bucket4j动态限速）

vue3 手动封装城市三级联动

Angular中Webpack与ngx-build-plus 浅学

大模型智能体核心技术：CoT与ReAct深度解析

信息系统分析与设计复习

Linux【5】-----编译和烧写Linux系统镜像（RK3568）

记一次spark在docker本地启动报错

【向量库】Weaviate 搜索与索引技术：从基础概念到性能优化

ABB馈线保护 REJ601 BD446NN1XG

Heygem50系显卡合成的视频声音杂音模糊解决方案

Gitlab + Jenkins 实现 CICD

无头浏览器技术：Python爬虫如何精准模拟搜索点击

SDU棋界精灵——硬件程序ESP32实现opus编码

Spring AI中使用ChatMemory实现会话记忆功能

Qt 按钮类控件（Push Button 与 Radio Button）（1）

生成对抗网络（GAN）损失函数解读

汇编语言学习（三）——DoxBox中debug的使用

【Java基础】向上转型（Upcasting）和向下转型（Downcasting）