当前位置: 首页 > article >正文

OneRec:生成式推荐模型在短视频场景下的端到端实践与优化

1. 生成式推荐模型为何成为短视频行业新宠最近两年生成式推荐模型正在悄悄改变短视频平台的推荐逻辑。传统推荐系统像流水线上的工人每个环节各司其职召回负责大海捞针粗排快速筛选精排细致打分最后重排考虑业务规则。这种分阶段处理的方式存在明显短板——就像接力赛跑任何一棒掉链子都会影响最终结果。OneRec这类生成式模型直接把推荐过程变成了单人全能赛。它用Transformer架构模拟人类推荐逻辑观察你的历史行为点赞/收藏/转发像朋友聊天那样逐步说出你可能喜欢的视频列表。我在快手实际项目中验证过这种端到端方案能让用户观看时长提升1.6%相当于每天多留住用户数百万分钟。关键突破在于语义ID生成机制。传统推荐用数字ID标识视频就像用学号找人完全看不出特征。而OneRec先用多模态模型提取视频的人格特征画面、语音、文字的综合embedding再通过改进的平衡k-means算法给视频打上具有语义的个性标签。举个例子萌宠视频可能被标记为[娱乐-动物-治愈系]这种标签体系让推荐过程更具可解释性。2. OneRec模型架构的三大创新设计2.1 稀疏MOE结构参数效率革命模型采用Encoder-Decoder架构时最头疼的就是参数膨胀问题。OneRec的解决方案堪称精妙——把传统FFN层改造成稀疏混合专家(MOE)系统。具体实现时每个输入只会激活约1/8的专家网络这样110亿参数的模型实际计算消耗只相当于30亿参数模型。我们在A100显卡上测试推理速度比稠密模型快2.3倍。配置MOE层时要注意这些细节# 典型配置示例 moe_layer MOELayer( experts[FFN(d_model1024) for _ in range(16)], # 16个专家 gateNoisyTopkRouter(k2), # 每次选top2专家 train_capacity_factor1.0, eval_capacity_factor0.5 )实际部署中发现专家数量超过32个时会出现专家退化现象——部分专家长期不被激活。我们的优化方案是引入负载均衡损失函数确保各专家利用率维持在5%-15%之间。2.2 行为序列的Cross-Attention融合用户历史行为不是简单拼接而是通过动态注意力机制融入解码过程。具体来说当模型生成第n个推荐时会特别关注历史行为中与当前生成路径相关的部分。这就像推荐美食时系统会重点参考你最近搜索过的餐厅而非上周看过的宠物视频。技术实现上有两个关键点行为序列编码器使用滑动窗口机制最近的100个行为保留细节较早的1000个行为压缩为摘要向量Cross-Attention层采用动态头数分配对短视频这类多模态内容视觉和文本特征分别用不同的注意力头处理2.3 基于DPO的偏好对齐策略传统强化学习需要在线试错这在推荐系统里风险太高。OneRec采用的**迭代偏好对齐(IPA)**方案很巧妙预训练奖励模型(RM)在用户行为预测任务上微调最后隐藏层输出作为偏好信号DPO训练阶段用beam search生成16个候选序列RM给其中最符合/最不符合用户画像的样本打标签动态更新机制每处理10万样本就更新一次参考模型避免分布偏移我们在abtest中发现DPO比例控制在15%-20%时效果最佳。超过这个阈值模型会过度迎合短期兴趣导致推荐多样性下降。3. 语义ID生成的全链路优化3.1 分层聚类构建Codebook视频语义ID的生成过程像给图书馆藏书分类先用CLIP等模型提取视频的内容指纹(1024维向量)执行分层平衡k-means聚类第一层按大类分如20个簇第二层每个大类再细分如50个子类最终形成1000个语义单元的标准体系这个过程的创新点在于动态平衡算法当某个类别视频量过大时自动触发分裂条件反之稀疏类别会合并。我们在处理快手4亿视频库时聚类耗时从32小时优化到6小时主要靠两项改进使用Faiss的IVF-PQ加速近邻搜索采用异步参数更新聚类与质心计算并行3.2 语义ID的递归分配策略给新视频打标签不是简单查表而是迭代细化的过程初始化用视频embedding匹配最接近的顶层类别细化在选定的大类中逐层向下匹配子类别回溯当底层匹配置信度0.7时返回上一级重新选择路径这种机制特别适合处理跨界内容比如科普向的美食视频。实测显示递归策略使长尾视频的推荐准确率提升27%。4. 实战效果与调优心得4.1 线上AB测试关键指标在快手1%流量桶测试中1B参数的OneRec模型交出这样的成绩单指标基线系统OneRec变化幅度人均观看时长45.6min46.3min1.6%点赞率8.2%8.7%6.1%分享率3.1%3.4%9.7%多样性(熵)2.452.689.4%值得注意的是模型在冷启动用户表现更突出新用户7日留存提升12.3%说明生成式推荐对稀疏数据更鲁棒。4.2 踩坑后总结的调优技巧MOE层初始化专家网络不能随机初始化应该用稠密模型参数作先验。我们采用蒸馏微调策略先训练标准Transformer再拆分成MOE结构DPO样本过滤对播放时长3秒的误触行为要过滤否则RM会学习到噪声信号语义ID维度实践表明1000-1500个语义单元最适合短视频场景过细会导致长尾item难以匹配在线学习每周用新数据微调语义ID分配器避免概念漂移。模型结构不适合频繁更新容易破坏学到的用户偏好表示有个反直觉的发现在精排阶段保留少量业务规则如新视频扶持反而比纯端到端方案效果更好。这可能是因为生成式模型对实时数据反馈有滞后性。

相关文章:

OneRec:生成式推荐模型在短视频场景下的端到端实践与优化

1. 生成式推荐模型为何成为短视频行业新宠 最近两年,生成式推荐模型正在悄悄改变短视频平台的推荐逻辑。传统推荐系统像流水线上的工人,每个环节各司其职:召回负责大海捞针,粗排快速筛选,精排细致打分,最后…...

STL分解实战:从原理到应用的时间序列分析指南

1. STL分解的基本原理与核心价值 STL分解全称为Seasonal-Trend decomposition using LOESS,这个看似复杂的名字其实蕴含着非常直观的时间序列处理逻辑。想象你正在观察一条蜿蜒的山路,STL分解就像帮你把这条路拆解成三个关键部分:山坡本身的倾…...

YOLOv11 OBB实战:手把手构建旋转目标检测数据集

1. 为什么需要旋转目标检测? 在传统的目标检测任务中,我们通常使用水平矩形框(HBB)来标注物体。这种标注方式简单直接,但对于某些特定场景下的物体检测效果并不理想。比如在遥感图像中,飞机、船只等物体往往…...

Flutter系列之Dialog宽度自定义的实战技巧与避坑指南

1. 为什么你的Dialog宽度设置总是失效? 很多Flutter新手都会遇到这样的困惑:明明给Dialog的child设置了width属性,为什么显示出来还是默认的宽度?这个问题我刚开始接触Flutter时也踩过坑。其实根本原因在于Dialog组件内部使用了Co…...

高炮广告牌哪个公司好

开篇:定下基调在当今的广告宣传领域,高炮广告牌以其显著的位置和强大的视觉冲击力,成为众多企业推广品牌和产品的重要选择。本次测评旨在为对高炮广告牌感兴趣的人群,提供一份客观、专业的参考,帮助大家了解市场上不同…...

19 多语言切换实操:一个指令,让AI适配任意编程语言

多语言切换实操:一个指令,让AI适配任意编程语言 摘要 本文为《30天掌控AI编程:从指令到落地,手把手教你指挥AI写代码》系列第十九篇,属于第三阶段多语言实战核心内容。本篇专注AI代码跨语言无缝切换这一高频痛点,针对零基础开发者、多技术栈项目人员,拆解如何通过结构…...

Redis专题(二)

1. Redis的简介Redis支持多种数据结构,有广泛的业务应用场景。数据保存在内存,读写性能高,很适合做缓存。数据可以持久化到硬盘,可以做数据库来用。官⽅对Redis的作⽤,也已经定位成了三个⽅⾯:Cache(缓存)&…...

18 指挥AI批量生成业务代码,大幅提升开发效率

指挥AI批量生成业务代码,大幅提升开发效率 摘要 本文为《30天掌控AI编程:从指令到落地,手把手教你指挥AI写代码》系列第十八篇,属于第三阶段多场景实战核心内容。本篇聚焦业务代码批量生成这一高效开发痛点,针对企业开发中大量重复、模块化的业务场景,讲解如何通过结构…...

17 指挥AI写Mamba相关模型代码,快速适配大模型场景

指挥AI写Mamba相关模型代码,快速适配大模型场景 摘要 本文为《30天掌控AI编程:从指令到落地,手把手教你指挥AI写代码》系列第十七篇,属于第三阶段多场景实战核心内容。本篇聚焦当下大模型领域热门的Mamba架构,针对零基础大模型开发、无深度学习基础的使用者,拆解指挥AI…...

效率飞跃:基于快马ai定制openclaw在ubuntu上的高级自动化部署方案

最近在Ubuntu上部署OpenClaw时,发现手动配置实在太费时间了。作为一个经常需要部署各种开源工具的开发老鸟,我决定探索一套自动化方案来提升效率。经过反复实践,终于总结出一套高效的部署流程,现在分享给大家。 自动化部署方案设…...

城通网盘解析终极指南:如何免费获取高速直连下载地址

城通网盘解析终极指南:如何免费获取高速直连下载地址 【免费下载链接】ctfileGet 获取城通网盘一次性直连地址 项目地址: https://gitcode.com/gh_mirrors/ct/ctfileGet 在数字化信息时代,城通网盘作为国内广泛使用的文件分享平台,却因…...

PostgreSQL 初体验

PostgreSQL 安装一、核心基础1. 简介PostgreSQL 是开源对象关系型数据库(ORDBMS),源自加州伯克利分校,兼容 SQL 标准,支持事务、复杂查询与扩展。2. 核心特点完全开源,许可宽松高度符合 SQL 标准&#xff0…...

零基础入门:借助claude code在快马平台轻松创建第一个web应用

作为一个刚接触编程的新手,我最近尝试用InsCode(快马)平台做了一个待办事项应用,整个过程比想象中顺利很多。这里记录下我的学习过程,希望能帮到同样零基础的朋友。 项目准备阶段 刚开始我连HTML、CSS和JavaScript的区别都分不清。好在平台…...

三维空间频谱时序预测模型开发完整报告

三维空间频谱时序预测模型开发完整报告 一、项目背景与目标 本项目基于UrbanRadio3D静态数据集,构建端到端的深度学习模型,实现对低空三维空间频谱(路径损耗)的时序演化预测。城市环境中的无线电传播受建筑物遮挡、反射等因素影响,呈现出复杂的空间分布和时间动态特性(…...

从“炼金术”到“建筑学”:深度学习结构设计的五大范式

在深度学习的早期,我们往往沉迷于增加层数、调整学习率或更换激活函数,这种“调参黑盒”更像是某种现代炼金术。但随着领域的发展,优秀的架构设计正逐渐转向“建筑学”——即基于问题的内在物理性质或几何约束,去构建具有特定“脾…...

【Agent】Microsoft Agent Framework 实战:打造智能 Git 周报生成工具

Microsoft Agent Framework 实战:打造智能 Git 周报生成工具从手动写周报到 AI 自动生成,用 Python Microsoft Agent Framework RC6 构建你的第一个 Agent 应用一、前言:程序员周报的痛点 每周五下班前,你是不是都在对着 Git 提交…...

学习Latex时的第一个tex内容

学习视频为: https://www.bilibili.com/video/BV1S741127Sg/ https://www.bilibili.com/video/BV1CtfMBGEPp/ 环境的语法结构: 最完整的结构 \begin{环境名}[参数列表] 内容 \end{环境ming} 简化版本(一般在行内使用) \环境名[参数…...

黑马点评实战篇知识点整理-秒杀

全局唯一id问题订单表使用数据自增id:id的规律性太明显受到单表数据量的限制定义在分布式系统下用来生成全局唯一id的工具 要满足以下特性: 唯一性、高可用、高性能、递增性、安全性实现方案(基于Redis自增的策略)64位id1位符号位…...

C++ 数据库缓冲池管理:基于 C++ 实现的 LRU-K 页面置换算法在海量数据访问场景下的命中率优化

各位专家、同仁,下午好! 今天我们齐聚一堂,共同探讨一个在数据库核心组件中至关重要的议题:C 数据库缓冲池管理:基于 C 实现的 LRU-K 页面置换算法在海量数据访问场景下的命中率优化。在当今数据爆炸的时代&#xff0c…...

C++ 与 事务多版本并发控制(MVCC):在 C++ 存储内核中利用时间戳排序实现无锁读写冲突控制

各位开发者、架构师,以及对高性能并发系统充满热情的同仁们,大家好!今天,我们将深入探讨一个在现代数据库和存储系统中至关重要的主题:多版本并发控制(MVCC),并聚焦于如何在 C 存储内…...

C++ Move 构造函数的优化原理

C Move构造函数的优化原理 在C11中,移动语义的引入彻底改变了资源管理的方式,而Move构造函数则是实现高效资源转移的核心机制之一。传统拷贝构造函数在涉及动态内存或大型对象时可能带来高昂的性能开销,而Move构造函数通过“窃取”临时对象的…...

从零开始:人工神经网络入门实战 - 用TensorFlow实现MNIST手写数字识别

1. 引言:为什么MNIST是神经网络的"Hello World"? 当你第一次接触编程时,通常会写一个"Hello World"程序。在深度学习领域,MNIST手写数字识别就是那个经典的"Hello World"!这个由美国国…...

ICRA 2025自动叉车顶会论文拆解:ADAPT如何在真实复杂场景完成托盘搬运?

ICRA 2025 最新AGV顶会论文拆解:ADAPT自动叉车系统,如何在真实复杂户外场景完成托盘搬运?如果说仓库 AGV 研究已经逐渐成熟,那么真正更难的,其实是户外、非结构化、天气变化大、障碍物复杂的施工场地搬运。 这篇来自 A…...

2025届毕业生推荐的五大AI学术平台实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 因人工智能技术迅猛发展,AI辅助毕业论文写作成众多学子实际可选之路,…...

2026最权威的十大AI论文工具推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 当今,人工智能技术于学术写作范畴的运用愈发广泛,该技术的关键价值在…...

2026届最火的AI辅助论文网站实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 当前,主要被划分成三类的AI论文写作辅佐平台分别是:文献检索跟整理&a…...

探索三维流固耦合中岩石试样孔隙度变化的奇妙世界

三维流固耦合,考虑岩石试样孔隙度变化在工程和科学研究领域,三维流固耦合问题一直是备受关注的焦点,而当考虑到岩石试样孔隙度变化时,这个问题更是增添了不少复杂性与趣味性。 三维流固耦合基础概念 简单来说,流固耦合…...

D模型生成:从二维图像重建三维结构

从二维图像重建三维结构:D模型的革命性突破 在计算机视觉和人工智能领域,从二维图像重建三维结构一直是一项极具挑战性的任务。传统的三维建模方法依赖多视角图像或深度传感器,而近年来,基于深度学习的D模型(如Diffus…...

海康云台 ISPAI 二次开发

最近做了个视频会议的项目,硬件用的海康球机DS-2DC4A212IW-DE/C,甲方要求在会议内封装一个云台可以进行拖拽 控制摄像头方向以及焦距的功能,官方给的SDK还不能直接复用,只能手搓了,下面是代码可直接复用,需…...

1111111111111111111111

111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111...