当前位置：首页 > news >正文

认识一下 Mochi-1--最新的免费开源人工智能视频模型

news 2026/5/11 18:01:09

Genmo 是一家专注于视频生成的人工智能公司，该公司宣布发布 Mochi 1 的研究预览版。Mochi 1 是一种新的开源模型，可根据文本提示生成高质量视频，其性能可与 Runway 的 Gen-3 Alpha、Luma AI 的 Dream Machine、Kuaishou 的 Kling、Minimax 的 Hailuo 等领先的闭源/专有竞争对手媲美，甚至超过它们。

Mochi 1 采用 Apache 2.0 许可，用户可免费使用尖端的视频生成功能，而其他模型的价格从有限的免费层级开始，最高可达每月 94.99 美元（Hailuo 无限层级）。用户可以在 Hugging Face 上免费下载完整的权重和模型代码，不过需要 "至少 4 个 "Nvidia H100 GPU 才能在用户自己的机器上运行。

随着越来越多的公司发布自己的模型，生成式人工智能大战正进入白热化阶段。生成视频似乎是当前最大的战场，而 Genmo 则采取了不同的方法。

该公司将其 Mochi-1 模型作为 "研究预览版 "发布，但新的视频生成模型属于 Apache 2.0 许可范围，因此是开源的，可以拆开再组装起来。

这也意味着Mochi-1可以免费使用，你可以在Genmo的网站上亲身体验。Mochi-1开源的好处还在于，它将来可以在所有常见的生成式人工智能平台上使用，有朝一日还可以在优秀的游戏 PC 上运行。

在这里插入图片描述
Huggingface: genmo/mochi-1-preview
GIthub: https://github.com/genmoai/models

推动最先进技术的发展

Mochi 1 为视频生成领域带来了多项重大进步，包括高保真运动和强大的及时性。

根据 Genmo 的说法，Mochi 1 擅长遵循详细的用户指令，可以精确控制生成视频中的人物、设置和动作。

Genmo 将 Mochi 1 定位为缩小开放式和封闭式视频生成模式之间差距的解决方案。

"我们距离生成视频的未来还有1%的距离。真正的挑战是创建长、高质量、流畅的视频。Genmo 首席执行官兼联合创始人 Paras Jain 在接受 VentureBeat 采访时说："我们非常重视提高运动质量。

Jain 和他的联合创始人创办 Genmo 的使命是让每个人都能使用人工智能技术。"贾因强调说："视频是生成式人工智能的下一个前沿领域，我们认为将其交到普通人手中非常重要。他补充说："我们从根本上认为，让这项技术平民化，让尽可能多的人掌握它，这一点非常重要。这也是我们将其开源的原因之一。

Genmo 声称，在内部测试中，Mochi 1 在及时性和运动质量方面优于大多数其他视频人工智能模型，包括专利竞争产品 Runway 和 Luna。

在这里插入图片描述

开放合作–但培训数据仍处于保密状态

Mochi 1 采用 Genmo 创新的非对称扩散变压器 (AsymmDiT) 架构。

它拥有 100 亿个参数，是有史以来最大的开源视频生成模型。该架构侧重于视觉推理，用于处理视频数据的参数是处理文本数据的四倍。

效率是该模型设计的一个关键方面。Mochi 1 利用视频 VAE（变异自动编码器）将视频数据压缩到原始大小的一小部分，从而降低了终端用户设备的内存需求。这使得开发人员社区更容易访问该模型，他们可以从 HuggingFace 下载模型权重或通过 API 进行集成。

Jain 认为，Mochi 1 的开源性质是推动创新的关键。"开放模型就像原油。它们需要完善和微调。他说："这正是我们希望为社区带来的，这样他们就可以在此基础上构建令人难以置信的新事物。

然而，当被问及该模型的训练数据集时–这是人工智能创意工具中最有争议的方面之一，因为有证据表明，许多人工智能创意工具都是在未经明确许可或补偿的情况下，在网上对大量人类创意作品进行训练的，其中一些还是受版权保护的作品。

他告诉 VentureBeat："一般来说，我们使用公开数据，有时也会与各种数据合作伙伴合作。"但出于竞争原因，他拒绝透露具体细节。“拥有多样化的数据真的很重要，这对我们来说至关重要。”

https://www.genmo.ai/

开发环境问题

在这里插入图片描述
https://github.com/kijai/ComfyUI-MochiWrapper 该框架允许低显存运行 mochi-1

认识一下 Mochi-1--最新的免费开源人工智能视频模型

Genmo 是一家专注于视频生成的人工智能公司，该公司宣布发布 Mochi 1 的研究预览版。Mochi 1 是一种新的开源模型，可根据文本提示生成高质量视频，其性能可与 Runway 的 Gen-3 Alpha、Luma AI 的 Dream Machine、Kuaishou 的 Kling、Minimax 的…...

编程日记 2024/10/27 10:21:33

Spring 的事务传播机制

Spring 的事务传播机制定义了一个事务方法在遇到已经存在的事务时如何处理。事务传播属性（Propagation）提供了七种机制，以适应不同的业务需求和事务边界管理。 1. Spring 的事务传播机制的类型 （1）REQUIRED&#xff…...

编程日记 2024/10/27 10:18:29

线性代数（1）——线性方程组的几何意义

线性代数的基本问题是求解个未知数的个线性方程； 例如：（方程1）。在线性代数的第一讲中，我们从Row Picture、Column Picture、Matrix Picture三个角度来看这个问题。上面的系统是二维的。通过添加第三个变量&#…...

编程日记 2024/10/27 10:17:28

写给自己的一些心得体会

为什么是CSDN??? 最近跑实验跑得绝望，感觉自己兜兜转转走了太多太多的弯路，我不知道这样的弯路什么时候是个尽头，就像在USJ排队，看似好像要到入口了，实则一转头还是无尽绵延的队伍。走了这么多弯路，总要…...

编程日记 2024/10/27 10:16:26

论文阅读（二十九）：Multi-scale Interactive Network for Salient Object Detection

文章目录 Abstract1.Introduction2.Scale VariationProposed Method3.1Network Overview3.2Aggregate Interaction Module3.3 Self-Interaction Module3.4Consistency-Enhanced Loss 4.Experiments4.1Implementation Details4.2 Comparison with State-of-the-arts4.3Ablation …...

编程日记 2024/10/27 10:15:25

常见存储器及其特点

： 一、只读存储器（ROM）及其类型 1. ROM 特点：存储的数据固定不变，只能读出不能写入，且断电后数据不丢失。应用：通常用于存储系统程序，如BIOS等。 2. PROM（可编程只读…...

编程日记 2024/10/27 10:13:23

《向量数据库指南》——text-embedding-3-large与Mlivus Cloud打造语义搜索新纪元

使用text-embedding-3-large生成向量并将向量插入Mlivus Cloud实现高效语义搜索的深度解析与实战操作在数字化时代，数据的处理和存储方式正在经历前所未有的变革。特别是随着大数据和人工智能技术的快速发展，向量数据库作为一种新型的数据存储和查询方式，正逐渐受到越来越…...

编程日记 2024/10/27 10:12:22

通过 Bytebase API 查看数据库审计日志

原文地址代码库 Bytebase 是一款数据库 DevOps 和 CI/CD 工具，专为开发者、DBA 和平台工程团队设计。虽然它提供了直观的 GUI 来管理数据库 schema 变更和访问控制，但有些团队可能希望使用 Bytebase API 将 Bytebase 集成到现有的 DevOps 平台中。在之…...

编程日记 2024/10/27 10:11:20

# 渗透测试# 1.安全见闻（6）通讯协议

安全见闻6 通讯协议 ##B站陇羽Sec## 潜在的安全问题所涉及的领域无线电安全，协议分析，web渗透，逆向分析通讯协议涉及的安全主要包括以下几个方面： 1.1 保密性问题 …...

编程日记 2024/10/27 10:10:19

[Gdiplus/Gdi]_[中级]_[实现多行文本的多种颜色绘制-富文本绘制]

场景在开发WTL/WIN32界面程序时，有时候需要绘制多行的段落文本，但是文本里的数值需要设置红色以便能让人第一时间关注到它。这种文本可以称之为富文本。GDI的DrawText和GDIPlus的DrawString方法都只能连续绘制某个颜色的文本。怎么实现？说明在《绘图实现单行文本的多种颜色…...

编程日记 2024/10/27 10:06:12

Ubuntu如何创建一个子用户并赋与管理员权限

在Ubuntu操作系统中，如何创建一个子用户并赋与管理员权限一、创建用户 sudo useradd -m -s /bin/bash test详细解释： sudo：以超级用户（root）权限执行该命令。useradd 命令通常需要管理员权限，因此需要加上 sudo。 useradd：创建新用户的命令。 -m：指示系统为新用户创建…...

编程日记 2024/10/27 10:05:01

【Linux | IO多路复用】epoll的底层原理详解

epoll 是一种高效的 I/O 多路复用机制，广泛用于 Linux 系统中，用于处理大量并发的文件描述符。它比传统的 select 和 poll 方法具有更好的性能，特别是在处理大量并发连接时。 1.epoll的设计思路 epoll是在select 出现 N 多年后才被发明的&a…...

编程日记 2024/10/27 10:02:55

npm run serve 提示异常Cannot read property ‘upgrade‘ of undefined

npm run serve 提示Cannot read property ‘upgrade’ of undefined 一般是proxy的target代理域名问题导致的，如下： 解决方案： proxy: { “/remoteDealerReportApi”: { target: ‘http://demo-.com.cn’, //此域名有问题，会导致…...

编程日记 2024/10/27 10:01:50

Muggle OCR 是一个高效的本地OCR（光学字符识别）模块

Muggle OCR 是一个高效的本地OCR（光学字符识别）模块，专为“麻瓜”设计，用于简化文本识别的过程。这个模块特别适用于处理印刷文本和解析验证码1。以下是一些关于 Muggle OCR 的主要特点和使用方法： 特点：…...

编程日记 2024/10/27 10:00:44

【SpringBoot】万字源码解析——启动流程

Spring Boot启动流程 Spring Boot 的入口类： SpringBootApplication public class IntelGradingApplication {public static void main(String[] args) {SpringApplication.run(IntelGradingApplication.class, args);} }Spring Boot 的启动过程可以分为两方面&am…...

编程日记 2024/10/27 9:58:39

Nginx 配置初步下

Nginx 配置初步(下) 一行代表一个指令； 每个指令有其上下文环境，比如 listen 指令只能在 http 指令块中出现，不能单独出现。1. Http 服务配置初步 1.1 常用指令 Nginx 的所有模块，打开模块我们就能看到模块中支持的指令。最常用…...

编程日记 2024/10/27 9:56:34

可视化ETL平台-Kettle的安装及简单使用

本章知识简介主线A: 自连接查询; 主线B: 安装JDK与Kettle; 主线C: 使用Kettle工具. 本章目标： 1: 知道使用一张表可以实现自连接查询; [了解]注意: 左表、右表都是同一张表 2: 了解Kettle环境的安装流程; [了解]a.安装JDKb.安装Kettle 3: 熟悉使用kettle将txt数…...

编程日记 2024/10/27 9:55:32

java8 动态加载jar包至系统的classpath

1. io.test包创建MyMain.java类，创建addJarToClasspath方法将jar包动态加载进系统的classpath中 package io.test;import java.io.File; import java.net.URL; import java.net.URLClassLoader; import java.lang.reflect.Method;public class MyMain {public st…...

编程日记 2024/10/27 9:54:31

C++二级题计算好数：1数大于0数(二进制的位运算)

1、题目若将一个正整数化为二进制数，在此二进制数中，我们将数字1的个数多于数字0的个数的这类二进制数称为好数。例如： (13)10 (1101)2，其中1的个数为3，0的个数为1，则此数是好数； (10)10 (1…...

编程日记 2024/10/27 9:53:30

数字孪生城市：智慧城市的未来蓝图

在当今数字化时代，智能技术的广泛应用正在改变人们的生活和工作方式。数字孪生城市作为未来新型智慧城市演进的重要方向，数字孪生城市是一种将城市物理世界的各个方面转化为数字形式的技术，通过网络空间与物理世界之间的实时数据交换和仿真分…...

编程日记 2024/10/27 9:50:27

编译原理实战：手把手教你化简DFA

1. 从零开始理解DFA化简第一次接触DFA化简这个概念时，我盯着课本上那些复杂的箭头和状态图发了好一会儿呆。作为一个编译原理的初学者，最让我困惑的是：为什么已经有了能工作的DFA，还要费劲去化简它？直到在实际项目中遇…...

编程新知 2026/5/11 17:44:47

3分钟零部署：在浏览器中畅玩开源三国杀网页版

3分钟零部署：在浏览器中畅玩开源三国杀网页版【免费下载链接】noname 项目地址: https://gitcode.com/GitHub_Trending/no/noname 还在为找不到合适的桌游伙伴而烦恼？想随时随地体验三国杀策略对决的乐趣？开源三国杀网页版为你提供了…...

编程新知 2026/5/11 17:42:46

3个关键场景解析：如何使用iperf3 Windows版精准诊断网络性能问题

3个关键场景解析：如何使用iperf3 Windows版精准诊断网络性能问题【免费下载链接】iperf3-win-builds iperf3 binaries for Windows. Benchmark your network limits. 项目地址: https://gitcode.com/gh_mirrors/ip/iperf3-win-builds 在当今数字化时代&…...

编程新知 2026/5/11 17:33:22

60.人工智能实战：大模型 SLO 怎么制定？从“感觉系统还行”到可量化的质量、延迟、成本与安全指标

人工智能实战：大模型 SLO 怎么制定？从“感觉系统还行”到可量化的质量、延迟、成本与安全指标一、问题场景：业务问系统稳不稳定，团队只能说“还可以” 大模型系统上线后，业务方经常会问：现在系统稳定吗？效果有没有变好？成本是否可控？用户体验怎么样？如果团队只…...

编程新知 2026/5/11 17:06:53

从零搭建Modbus通信测试环境：TCP与串口双模式实战

1. 为什么需要搭建Modbus测试环境？ 刚接触工业通信协议时，我最头疼的就是找不到合适的设备做测试。真实PLC动辄上万元，而Modbus作为工业领域最常用的通信协议之一，其实完全可以用软件模拟。搭建本地测试环境的好处很明显&#xff…...

编程新知 2026/5/11 16:54:31

JScope RTT模式实战：在GD32F303上实现1MB/s高速数据流录制与性能分析

JScope RTT模式实战：在GD32F303上实现1MB/s高速数据流录制与性能分析在嵌入式系统开发中，实时数据采集与分析往往是调试过程中最具挑战性的环节之一。当工程师需要捕捉高速瞬态信号、分析多变量交互行为或进行故障诊断时，传统调试工具常常显…...

编程新知 2026/5/11 16:36:00

K3救砖实战：从梅林回退官方的硬核操作指南

1. 救砖前的准备工作当你发现心爱的K3路由器因为刷了梅林固件变砖时，先别急着砸机器。我经历过三次成功救砖，总结出最重要的经验就是：准备工作决定了80%的成功率。首先确认你的路由器是真的"砖"了——尝试按住复位键30秒以上&…...

编程新知 2026/5/11 16:21:37

3种方法修复ROG游戏本色彩配置文件丢失问题：G-Helper实战指南

3种方法修复ROG游戏本色彩配置文件丢失问题：G-Helper实战指南【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenb…...

编程新知 2026/5/11 16:09:58

自建S3兼容对象存储：Shebe部署、集成与运维全指南

1. 项目概述：一个面向开发者的开源文件存储与分发解决方案最近在折腾个人项目，需要处理用户上传的图片、文档，还要能快速分发到前端展示。自己搭存储服务吧，从对象存储到CDN，配置起来一堆事儿，用第三方云服…...

编程新知 2026/5/11 16:05:55

OpenOCD实战：从源码编译到JTAG调试RISC-V平台

1. OpenOCD与RISC-V调试基础第一次接触OpenOCD调试RISC-V芯片时，我对着开发板上的JTAG接口发了半天呆。作为嵌入式开发者，我们都经历过这种从零搭建调试环境的阵痛期。OpenOCD就像一位硬件调试的瑞士军刀，它能通过JTAG接口与各种处理器架构对…...

编程新知 2026/5/11 15:59:50

推动最先进技术的发展

开放合作–但培训数据仍处于保密状态

开发环境问题

相关文章：