当前位置: 首页 > article >正文

从ESMM到MMoE:当推荐系统多目标‘闹矛盾’时,Google的‘多门控专家’怎么当和事佬?

从ESMM到MMoE多任务学习模型如何化解推荐系统的目标冲突推荐系统发展到今天早已不再是简单的点击率预测工具。当我们需要同时优化点击率、转化率、观看时长、互动率等多个指标时单任务学习模型就显得力不从心了。这就像让一个厨师同时做川菜和粤菜——如果只给一套厨具难免顾此失彼。多任务学习(MTL)正是为解决这类问题而生而Google提出的MMoE模型则像一位精明的餐厅经理为每位厨师配备了专属工具组合。1. 多任务学习的演进之路早期的推荐系统大多采用单目标优化比如只预测点击率(CTR)。但随着业务复杂度提升我们需要模型同时预测点击率、转化率(CVR)、观看时长等多个指标。这就引出了多任务学习的基本思想让模型共享底层特征表示同时在顶层针对不同任务进行专门优化。阿里团队提出的ESMM模型是这一领域的里程碑。它创造性地解决了CVR预估中的样本选择偏差问题——传统方法只用有点击的样本来训练CVR模型而ESMM通过同时建模CTR和CTCVR(点击后转化率)间接得到CVR预估值。其网络结构采用典型的共享底层(Share-Bottom)设计[输入层] | [共享底层DNN] / \ [CTR塔] [CVR塔]这种结构在任务高度相关时表现优异但当任务差异较大时(如同时预测点击率和视频完播率)共享底层就会成为瓶颈。就像用同一把刀切肉和雕花效果必然打折扣。2. 专家混合从OMoE到MMoE的进化Google的解决方案引入了专家混合(Mixture of Experts, MoE)的概念。想象有多位各有所长的厨师(专家)而门控网络就像餐厅经理根据菜品特点决定让哪些厨师参与工作。2.1 基础MoE结构MoE的核心组件包括专家网络多个独立的前馈神经网络每个都是特定领域的专家门控网络决定如何组合专家们的输出数学表达为y Σ(g(x)_i * E_i(x))其中E_i是第i个专家g(x)_i是该专家对应的权重。2.2 OMoE与MMoE的关键区别最初的OMoE(One-gate MoE)对所有任务使用同一个门控网络而MMoE的创新在于表OMoE与MMoE结构对比特性OMoEMMoE门控网络数量全局1个每个任务1个参数共享程度完全共享门控专家共享门控独立适用场景任务高度相关任务相关性不确定灵活性较低较高MMoE的数学表达更精细f_k(x) Σ(g^k(x)_i * E_i(x)) y_k h^k(f_k(x))其中g^k是第k个任务专属的门控网络。3. MMoE的实战表现与优势Google论文通过三组实验验证了MMoE的优越性3.1 人工合成数据测试通过控制任务相关性(皮尔逊系数从0到1)发现当任务相关性0.9时OMoE与MMoE表现相当当相关性0.5时MMoE显著优于OMoEShared-Bottom结构在所有情况下表现最差实验还发现MMoE训练更稳定在不同随机种子下loss方差更小3.2 真实场景数据在UCI收入数据集和大规模推荐系统上的测试显示MMoE相比Shared-Bottom模型AUC提升1.5%-2%线上AB测试指标提升显著模型鲁棒性更强不易陷入局部最优4. 实现MMoE的关键细节实际部署MMoE时需要注意几个关键点4.1 专家数量选择通常4-8个专家足够过多专家会增加计算成本且可能过拟合可通过验证集performance决定4.2 门控网络设计# Keras实现示例 class MMoE_Layer(tf.keras.layers.Layer): def __init__(self, expert_dim, n_expert, n_task): super().__init__() self.expert_layer [Dense(expert_dim) for _ in range(n_expert)] self.gate_layers [Dense(n_expert, activationsoftmax) for _ in range(n_task)] def call(self, x): experts [e(x) for e in self.expert_layer] gates [g(x) for g in self.gate_layers] return [tf.matmul(experts, g) for g in gates]4.3 训练技巧专家网络建议使用ReLU激活门控网络使用softmax确保权重归一化可采用课程学习策略先训练简单任务5. 何时选择MMoE实用指南不是所有场景都需要MMoE以下是决策参考表多任务学习模型选型指南场景特征推荐模型理由任务高度相关(如CTR/CVR)ESMM/Shared-Bottom结构简单效果足够任务中度相关MMoE平衡灵活性与复杂度任务完全独立单任务模型共享反而降低性能计算资源有限OMoE比MMoE参数更少在实际项目中我们曾遇到需要同时优化点击率和观看时长的场景。初期使用Shared-Bottom结构两个指标相互拉扯难以提升。切换到MMoE后点击率提升3.2%观看时长提升7.8%验证了其处理任务冲突的有效性。

相关文章:

从ESMM到MMoE:当推荐系统多目标‘闹矛盾’时,Google的‘多门控专家’怎么当和事佬?

从ESMM到MMoE:多任务学习模型如何化解推荐系统的目标冲突 推荐系统发展到今天,早已不再是简单的点击率预测工具。当我们需要同时优化点击率、转化率、观看时长、互动率等多个指标时,单任务学习模型就显得力不从心了。这就像让一个厨师同时做川…...

强化学习核心算法与工程实践全解析

1. 强化学习基础概念解析强化学习(Reinforcement Learning)是机器学习领域中最接近人类学习方式的范式之一。与监督学习需要大量标注数据不同,强化学习通过"试错"机制让智能体(Agent)在与环境(En…...

从‘仅追加’到‘伪更新’:深入拆解Elasticsearch Data Streams的底层机制与灵活操作

从‘仅追加’到‘伪更新’:深入拆解Elasticsearch Data Streams的底层机制与灵活操作 在时间序列数据处理的领域里,"仅追加"(append-only)一直被视为不可逾越的设计原则——直到我们开始理解Elasticsearch Data Streams…...

保姆级教程:用Python的data_downloader包搞定Sentinel-1精密轨道数据下载(含NASA账号配置)

零基础玩转Sentinel-1轨道数据:Python自动化下载全攻略 第一次接触遥感数据处理时,面对各种专业术语和复杂操作流程,很多人都会感到无从下手。特别是当需要获取卫星精密轨道数据这种看似"高深"的资料时,光是理解什么是…...

如何用SQL按条件计算移动求和_结合CASE与窗口函数

能,但CASE必须嵌套在SUM()内;ROWS比RANGE更可控;ORDER BY需唯一或加辅助列;NULL需显式处理为0;索引和窗口范围影响性能。用 SUM() 窗口函数 CASE 实现条件移动求和直接说结论:能,但必须把 CASE…...

别再怕手机丢了!手把手教你将Google身份校验器的OTP密钥备份到Web服务(Spring Boot + Docker实战)

构建高可用OTP备份系统:从手机迁移到私有化Web服务的全链路实践 你是否经历过手机突然丢失或损坏,导致所有绑定的双重验证服务瞬间瘫痪?去年一次登山途中,我的手机从悬崖滑落,随之消失的还有Google Authenticator中二十…...

还在手动刷新Elsevier投稿页面?这款Chrome插件让学术进度追踪自动化

还在手动刷新Elsevier投稿页面?这款Chrome插件让学术进度追踪自动化 【免费下载链接】Elsevier-Tracker 项目地址: https://gitcode.com/gh_mirrors/el/Elsevier-Tracker 每天登录Elsevier系统查看论文审稿状态,是否已经成为你的科研日常&#x…...

SQLite JDBC驱动:Java开发者应对嵌入式数据库挑战的终极方案

SQLite JDBC驱动:Java开发者应对嵌入式数据库挑战的终极方案 【免费下载链接】sqlite-jdbc SQLite JDBC Driver 项目地址: https://gitcode.com/gh_mirrors/sq/sqlite-jdbc 想象一下这样的场景:你正在开发一个需要轻量级数据存储的Java应用&#…...

(开源)华夏之光永存:重磅硬核|火箭回收综合性价比全面劣化:一次性+极致去冗余才是国家航天最优解(全文无废话、带参数、带对比)

重磅硬核|火箭回收综合性价比全面劣化:一次性极致去冗余才是国家航天最优解(全文无废话、带参数、带对比) 个人声明 我此前公开发表、撰写过多篇关于火箭回收技术的学术论文与技术分析文章,并非支持国家大力发展火箭回…...

如何永久保存微信聊天记录?WeChatMsg本地备份与数据分析终极指南

如何永久保存微信聊天记录?WeChatMsg本地备份与数据分析终极指南 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trendin…...

别再只盯着PSNR了!用Python实战对比MSE、SSIM、UQI,手把手教你选对图像相似度指标

图像相似度评估实战:从指标原理到场景化选择指南 当你在GitHub上开源了一个新的图像超分辨率模型,或在公司内交付了一套医疗影像增强系统时,最尴尬的时刻莫过于被问到:"这个结果到底好在哪里?"——而你只能支…...

别再死记硬背了!一张图帮你搞懂SRv6里那些‘End.X’、‘End.DT4’指令到底在干啥

SRv6指令集深度解析:从快递分拣到网络封装的实战指南 每次看到SRv6里那些像密码一样的End.X、End.DT4指令,是不是感觉脑袋嗡嗡作响?别担心,今天我们不搞术语轰炸,换个视角把这些抽象指令变成你日常生活中的熟悉场景。想…...

保姆级教程:在Ubuntu 20.04上搞定arm-linux-gnueabi交叉编译环境(含libmpfr.so.4报错解决方案)

从零构建ARM嵌入式开发环境:Ubuntu 20.04交叉编译实战指南 刚接触嵌入式开发的工程师常会遇到一个经典困境:在x86电脑上编写的代码,如何让ARM架构的开发板顺利运行?这个看似简单的问题背后,隐藏着工具链配置、库依赖解…...

DataGrip连接MySQL报错‘无效时区’?5分钟搞定配置并解锁它的SQL智能补全

DataGrip连接MySQL报错‘无效时区’?5分钟搞定配置并解锁它的SQL智能补全 第一次打开DataGrip准备大展身手,却被"Server returns invalid timezone"的红色报错拦住去路?别急着关掉这个强大的数据库IDE,其实只需要5分钟调…...

别扔!手把手教你用U盘和Telnet救活WD MyCloud Gen2变砖(保姆级图文教程)

WD MyCloud Gen2设备救援全指南:从红灯报警到系统重建 当你的WD MyCloud Gen2突然亮起红灯,所有指示灯疯狂闪烁,网络接口彻底失去响应时,那种绝望感任何NAS用户都能体会。这台曾经安静可靠的家庭存储伙伴,此刻变成了一…...

从Blender/Unity转战Godot?先搞定编辑器布局的“水土不服”(对比与迁移指南)

从Blender/Unity转战Godot?先搞定编辑器布局的“水土不服”(对比与迁移指南) 当你第一次打开Godot编辑器时,那种既熟悉又陌生的感觉可能会让你有些无所适从。作为从Blender或Unity转战而来的开发者,你已经习惯了某些工…...

Xtensa寄存器窗口机制实战解析:手把手教你理解ESP32 FreeRTOS的堆栈初始化(附避坑指南)

Xtensa寄存器窗口机制实战解析:手把手教你理解ESP32 FreeRTOS的堆栈初始化(附避坑指南) 在嵌入式系统开发领域,Xtensa架构以其独特的寄存器窗口机制闻名,却也成为许多开发者进阶路上的"拦路虎"。当你在ESP32…...

Linux服务器上配置gfortran:从零部署到高效编译你的Fortran代码

Linux服务器上配置gfortran:从零部署到高效编译你的Fortran代码 在科学计算和高性能计算领域,Fortran语言因其卓越的数值计算性能和成熟的数学库支持,依然是许多研究机构和实验室的首选工具。当我们需要在远程Linux服务器(如实验室…...

别再只盯着CPU了!AOSP编译加速实战:Linux内核调优、ccache与分布式编译技巧

突破硬件瓶颈:AOSP编译效率优化的三大高阶策略 每次等待AOSP编译完成时,看着屏幕上缓慢滚动的日志,你是否也想过要砸钱升级硬件?但真正资深的开发者都知道,软件优化才是解锁性能的关键。本文将带你跳出"堆配置&q…...

避开坑点!用TMS320F280039调试CAN通信时,关于邮箱、ID与中断的那些细节

避开坑点!用TMS320F280039调试CAN通信时,关于邮箱、ID与中断的那些细节 在嵌入式系统开发中,CAN总线因其高可靠性和实时性被广泛应用于工业控制、汽车电子等领域。作为TI C2000系列中的明星产品,TMS320F280039凭借其强大的实时控制…...

CN3862 具有太阳能最大功率点跟踪功能的降压型 4A 两节锂电池充电管理集成电路

概述: CN3862 是一款可使用太阳能板供电的 PWM 降压模式两节电池充电管理集成电路,独立对两节 电池充电进行管理,具有封装外形小,外围元器件少和使用简单等优点。 CN3862 具有涓流,恒流和恒压充电模式,非常适合两节锂电…...

CN3392 PFM 升压型双节锂电池充电控制集成电路

概述: CN3392是一款工作于2.75V到6.5V的PFM升压型双节锂电池充电控制集成电路。CN3392采用恒流 和准恒压模式(Quasi-CVTM)对电池进行充电管理,内部集成有基准电压源,电感电流检测单元,电池电压检测电路和片内MOSFET等,…...

3分钟搞定!让Windows资源管理器秒显iPhone照片缩略图的终极方案

3分钟搞定!让Windows资源管理器秒显iPhone照片缩略图的终极方案 【免费下载链接】windows-heic-thumbnails Enable Windows Explorer to display thumbnails for HEIC/HEIF files 项目地址: https://gitcode.com/gh_mirrors/wi/windows-heic-thumbnails 还在…...

CN3306 具有太阳能板 MPPT 功能的升压型多种电池充电集成电路

概述: CN3306是电流模式固定频率PWM升压型多种电池充电管理集成电路。CN3306的输入电压范围 4.5V至32V,外围元器件少,应用简单灵活,可用于锂电池,磷酸铁锂电池或钛酸锂电池的充电管 理。 CN3306 具有恒流和恒压充电模式&#xff0…...

Windows HEIC缩略图终极指南:3分钟让资源管理器完美预览iPhone照片

Windows HEIC缩略图终极指南:3分钟让资源管理器完美预览iPhone照片 【免费下载链接】windows-heic-thumbnails Enable Windows Explorer to display thumbnails for HEIC/HEIF files 项目地址: https://gitcode.com/gh_mirrors/wi/windows-heic-thumbnails 还…...

别再为ChatGPT API调用发愁了!5分钟在Cloudflare上搭个免费中转站,稳定又省心

5分钟构建ChatGPT API全球加速通道:Cloudflare Workers实战指南 ChatGPT API的开发者们经常面临网络延迟、地域限制和连接不稳定等问题。想象一下,当你精心设计的AI应用因为API调用失败而崩溃,或者用户因为响应缓慢而流失——这些痛点直接影响…...

Everspin高性能串口mram芯片MR25H40CDCR

与传统串行EEPROM或闪存不同,串口mram芯片MR25H40CDCR在读写时序上完全兼容这些常见存储器,但有一个关键优势——没有写入延迟。普通串行存储器在两次写入之间需要等待,而Everspin串口mram芯片MR25H40CDCR支持随机访问,读取和写入…...

从Kinect到iPhone LiDAR:深度图如何从‘玩具’变成分割算法的‘神助攻’?

从Kinect到iPhone LiDAR:深度传感技术如何重塑图像分割的边界 十年前,当微软Kinect首次将深度摄像头带入消费市场时,计算机视觉领域的研究者们既兴奋又沮丧。兴奋的是,我们终于能够以低廉的价格获取场景的深度信息;沮丧…...

PDMS二次开发实战:我是如何从零打造Naki.CI这个材料编码神器的

PDMS二次开发实战:从零构建材料编码工具Naki.CI的技术探索 在工程设计与材料管理领域,PDMS(Plant Design Management System)作为主流的工厂设计管理系统,其二次开发一直是个充满挑战的细分领域。传统材料编码方式存在…...

从零搭建PHP本地开发环境:除了phpStudy,你还可以试试手动配置Apache+PHP(含环境变量详解)

从零构建PHP开发环境:Apache与PHP深度配置指南 对于追求开发环境透明度和灵活性的PHP开发者而言,脱离集成环境的一键式安装,手动配置Apache与PHP组合不仅能获得更精细的控制权,更是理解Web服务器运行机制的绝佳途径。不同于phpSt…...