当前位置: 首页 > article >正文

一文看懂推荐系统:召回06:从矩阵补充到双塔,工业界为何弃用前者而拥抱后者?

1. 矩阵补充模型的前世今生我第一次接触矩阵补充模型是在2015年当时这个模型在学术界还相当流行。简单来说矩阵补充就是把用户ID和物品ID分别映射成向量然后通过内积来预测用户对物品的兴趣程度。听起来很美好对吧但实际应用中却处处碰壁。这个模型的核心思想其实很直观。想象你有一个巨大的Excel表格行代表用户列代表物品每个单元格记录着用户对物品的评分。但现实情况是这个表格99%都是空白的——因为用户不可能对所有物品都有评分。矩阵补充要做的就是猜出这些空白处的值。具体实现上模型包含两个embedding层一个把用户ID映射成向量另一个把物品ID映射成向量。训练时我们让这两个向量的内积尽可能接近真实的用户评分。比如用户A给电影B打了5星那么向量A和向量B的内积就应该接近5。2. 矩阵补充的三大致命伤2.1 特征利用的局限性我在实际项目中最头疼的就是矩阵补充对特征的处理方式。它只用了用户ID和物品ID这两个最原始的特征完全忽视了其他重要信息。比如在小红书场景下笔记的类目、关键词、发布时间用户的性别、年龄、地理位置等都对推荐效果至关重要。记得2017年我们做过一个对比实验在同样的数据量下加入物品特征的模型CTR提升了37%。这充分说明仅靠ID信息是远远不够的。就好比你相亲时只知道对方的名字其他信息一概不知这样能找到合适对象的概率可想而知。2.2 负样本构建的误区矩阵补充的另一个大问题是负样本的选择。它简单地把曝光未点击的样本作为负样本这在实际应用中效果很差。为什么呢因为用户没点击可能只是因为没看到而不是不喜欢。我们做过数据分析在小红书的信息流中用户平均只会浏览前20条内容。如果把后面没曝光的内容都当作负样本模型学到的其实是曝光位置而非用户真实兴趣。这就好比因为没看到超市货架底层的商品就断定自己不喜欢这些商品一样荒谬。2.3 损失函数的不足矩阵补充使用MSE损失函数做回归这在推荐场景下并不合适。工业界更倾向于使用交叉熵损失做分类因为推荐本质上是个排序问题我们更关心用户更喜欢A还是B而不是用户对A的评分是3.5还是4.0。2018年我们在微博做过AB测试在相同模型结构下使用交叉熵损失的模型相比MSE损失用户停留时长提升了22%。这个差距在亿级用户规模下带来的商业价值是巨大的。3. 双塔模型的崛起3.1 架构设计的进化双塔模型可以看作是矩阵补充的全面升级版。它最大的改进是允许使用丰富的特征用户侧可以加入 demographics、行为序列等特征物品侧可以加入类目、标签、内容embedding等特征。我特别喜欢双塔模型的一个设计是用户塔和物品塔是完全独立的。这意味着我们可以分别优化两个塔的结构。比如用户塔可以用Transformer处理行为序列物品塔可以用CNN处理图像特征。这种灵活性让模型能更好地适应不同场景。3.2 训练技巧的革新双塔模型在训练方式上也有重大改进。首先是负采样策略除了曝光未点击的样本我们还会随机采样一批全局负样本。其次是损失函数普遍使用softmax交叉熵或者对比损失更适合排序任务。我们在抖音的一个实验中发现合理的负采样策略能使Recall100提升近50%。具体做法是对热门物品进行降采样避免模型被少数热门物品主导。这就像给学生布置作业时既要有基础题也要有提高题才能全面考察学习效果。3.3 线上服务的优化双塔模型在线上服务时效率更高。用户向量可以预先计算并缓存只需要实时计算物品向量。相比之下矩阵补充需要存储整个用户和物品的embedding矩阵内存消耗要大得多。我们内部做过压力测试在千万级物品的场景下双塔模型的QPS能达到矩阵补充的5倍以上。这主要得益于两个方面一是ANN检索算法的优化二是服务架构的改进比如把用户向量缓存在Redis中。4. 工业界的最佳实践4.1 特征工程的艺术在实际项目中特征设计往往比模型结构更重要。我们的经验是用户侧要重点关注行为序列特别是近期的交互行为物品侧要充分利用内容信息比如文本、图像、视频的embedding。一个实用技巧是使用多模态融合。比如对短视频推荐我们会同时使用视频的视觉特征、音频特征、文本特征和发布者特征。这就像选秀节目评委要从多个维度考察选手不能只看颜值或才艺单一方面。4.2 采样策略的平衡负采样是影响模型效果的关键因素。我们通常采用以下策略全局随机采样保证覆盖长尾物品热门物品降采样避免模型偏向热门同类别采样增强细粒度区分能力曝光未点击保留部分真实负反馈这种组合采样策略在实践中效果显著。以淘宝为例采用这种策略后长尾商品的曝光量提升了28%同时整体CTR保持稳定。4.3 服务架构的优化线上服务要考虑多方面因素用户向量更新频率高频用户需要实时更新ANN索引构建平衡准确率和查询延迟缓存策略合理设置用户向量的过期时间降级方案在系统压力大时启用简化版模型我们在微信读书的项目中就遇到过这样的问题新用户刚注册时行为数据不足直接使用双塔模型效果不好。后来我们增加了冷启动策略结合内容相似度和热门榜单新用户次留率提升了15%。5. 从理论到实践的思考在实际工作中我见过太多团队盲目追求复杂模型却忽视了基础架构的优化。比如有团队花三个月开发了一个复杂的多任务模型但因为线上服务延迟太高最终效果还不如优化后的双塔模型。另一个常见误区是过度依赖离线指标。离线AUC提升不等于线上效果提升。我们内部有个原则任何模型改动必须经过AB测试验证。曾经有个模型离线指标提升5%但线上实验发现用户停留时间反而下降了后来分析发现是样本分布不一致导致的。技术选型时要考虑团队实际情况。初创公司可能更适合先用双塔模型打好基础等数据量和团队成熟度上来后再考虑更复杂的模型。这就像练武功要先扎马步直接学高级招式很容易走火入魔。

相关文章:

一文看懂推荐系统:召回06:从矩阵补充到双塔,工业界为何弃用前者而拥抱后者?

1. 矩阵补充模型的前世今生 我第一次接触矩阵补充模型是在2015年,当时这个模型在学术界还相当流行。简单来说,矩阵补充就是把用户ID和物品ID分别映射成向量,然后通过内积来预测用户对物品的兴趣程度。听起来很美好对吧?但实际应用…...

技术人生:从BERT到晚年,如何构建一个持续进化的AI心智模型

1. 从BERT到河流:AI模型的终身学习哲学 第一次看到BERT模型在NLP任务上的表现时,我正坐在办公室啃着冷掉的三明治。那是2018年的冬天,Transformer架构像洪水般冲垮了传统RNN的堤坝。但当时没人想到,这个突破会引发一个更本质的思考…...

采用LTC6820模数转换器实现隔离式SPI通信

描述 监测和控制不同的系统需要能够直接访问传感器和驱动器,最好是从一个中心位置,采用标准化通信方法(例如串行外设接口(SPI))进行访问。SPI是一种同步串行数据总线,帮助设备和中央控制单元之间进行长距离的数据交换。通信操作遵从主从原则是…...

利用千问3.5-2B构建AI Agent:自主任务规划与执行框架

利用千问3.5-2B构建AI Agent:自主任务规划与执行框架 1. 引言:当AI学会自主思考 想象一下,你只需要告诉AI"帮我整理一份关于新能源汽车市场的最新报告",它就能自动完成以下工作:搜索最新数据、分析关键趋势…...

STM32F0系列DMA通道不够用?手把手教你用SYSCFG重映射解决SPI和串口冲突(附完整代码)

STM32F0系列DMA通道资源优化实战:SPI与串口共存方案解析 在嵌入式开发中,资源冲突是工程师们经常遇到的棘手问题。最近在一个智能家居控制板项目中,我遇到了STM32F042芯片上SPI和USART同时使用DMA时出现的通道冲突问题。这个控制板需要同时驱…...

VisualCppRedist AIO:一站式解决Windows运行时依赖问题的专业解决方案

VisualCppRedist AIO:一站式解决Windows运行时依赖问题的专业解决方案 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾因"缺少MSVCRxxx…...

SteamCleaner游戏清理工具:快速释放硬盘空间的终极解决方案

SteamCleaner游戏清理工具:快速释放硬盘空间的终极解决方案 【免费下载链接】SteamCleaner :us: A PC utility for restoring disk space from various game clients like Origin, Steam, Uplay, Battle.net, GoG and Nexon :us: 项目地址: https://gitcode.com/g…...

终极OBS背景移除插件:如何免费实现专业级AI抠像效果

终极OBS背景移除插件:如何免费实现专业级AI抠像效果 【免费下载链接】obs-backgroundremoval An OBS plugin for removing background in portrait images (video), making it easy to replace the background when recording or streaming. 项目地址: https://gi…...

Arduino串口调试:从Serial.println()到数据可视化的实战解析

1. Arduino串口通信基础入门 第一次接触Arduino的开发者,往往会被串口通信这个概念吓到。其实它就像两个人对话一样简单——Arduino通过串口向电脑"说话",电脑通过串口监视器"听"并显示出来。Serial.println()就是Arduino最常用的&q…...

告别设备束缚!这款跨平台漫画神器让你随时随地畅享阅读乐趣

告别设备束缚!这款跨平台漫画神器让你随时随地畅享阅读乐趣 【免费下载链接】nhentai-cross A nhentai client 项目地址: https://gitcode.com/gh_mirrors/nh/nhentai-cross 还在为在不同设备间切换阅读漫画而烦恼吗?当你在地铁上用手机看漫画&a…...

终极冒险岛游戏编辑器:5分钟快速上手完整指南

终极冒险岛游戏编辑器:5分钟快速上手完整指南 【免费下载链接】Harepacker-resurrected All in one .wz file/map editor for MapleStory game files 项目地址: https://gitcode.com/gh_mirrors/ha/Harepacker-resurrected Harepacker-resurrected是一款专为…...

Rust 异步函数的底层运行逻辑

Rust异步编程的魔力:揭开底层运行逻辑的面纱 在现代高并发编程中,Rust的异步函数以其零成本抽象和高性能著称。但你是否好奇,一个简单的async fn背后究竟隐藏着怎样的运行机制?本文将深入探索Rust异步函数的底层逻辑,…...

Unicorn模拟器避坑指南:常见内存映射错误及解决方法

Unicorn模拟器内存映射实战:从原理到避坑指南 如果你曾经在逆向工程或二进制分析中使用过Unicorn模拟器,大概率遇到过这样的场景:精心编写的模拟代码突然崩溃,调试信息显示"UC_ERR_MAP"或"UC_ERR_READ_UNMAPPED&qu…...

别再怕网关单点故障了!手把手教你用华为eNSP模拟器配置VRRP(含S3700交换机实战)

企业级网络高可用实战:VRRP协议深度解析与华为eNSP配置指南 当核心网关突然宕机,整个办公区的网络连接瞬间中断——这种场景对于网络管理员来说无异于噩梦。传统网络架构中,默认网关通常采用静态配置,一旦这台设备出现故障&#x…...

5步精通Windows Subsystem for Android部署与调优:开发者实战指南

5步精通Windows Subsystem for Android部署与调优:开发者实战指南 【免费下载链接】WSA Developer-related issues and feature requests for Windows Subsystem for Android 项目地址: https://gitcode.com/gh_mirrors/ws/WSA Windows Subsystem for Androi…...

用Asian Beauty Z-Image Turbo做灵感素材:快速生成东方风格人物设定图

用Asian Beauty Z-Image Turbo做灵感素材:快速生成东方风格人物设定图 1. 工具介绍与核心优势 Asian Beauty Z-Image Turbo是一款专注于东方美学风格图像生成的本地化工具,特别适合需要创作东方风格人物设定图的创作者使用。它基于通义千问Tongyi-MAI …...

Phi-4-mini-reasoning 3.8B 嵌入式设备AI赋能:STM32项目中的轻量级推理集成

Phi-4-mini-reasoning 3.8B 嵌入式设备AI赋能:STM32项目中的轻量级推理集成 1. 当STM32遇上大模型:嵌入式智能的新可能 想象一下,一台只有拇指大小的STM32开发板,现在能够理解传感器数据背后的含义,预测设备故障&…...

告别环境配置噩梦:保姆级教程教你用ESP-IDF离线安装器搞定Windows开发环境(支持ESP32/ESP32-C3)

零基础玩转ESP32开发:Windows一站式环境配置指南 第一次接触ESP32开发时,最令人头疼的莫过于环境配置。记得我刚开始尝试在Windows上搭建ESP-IDF开发环境时,光是安装Python、Git、配置环境变量就折腾了大半天,最后还因为路径包含中…...

Qwen3-VL-8B开源可部署优势:完全离线运行、无API调用依赖、自主可控方案

Qwen3-VL-8B开源可部署优势:完全离线运行、无API调用依赖、自主可控方案 1. 项目概述 Qwen3-VL-8B是一个基于通义千问大语言模型的完整AI聊天系统,提供简洁美观的PC端聊天界面。这个系统最大的特点是完全离线运行,不需要任何外部API调用&am…...

OmegaConf保姆级教程:从环境变量到CLI参数的全链路配置合并技巧

OmegaConf实战指南:多源配置合并与优先级管理深度解析 在当今复杂的软件开发环境中,配置管理已成为DevOps和全栈开发者日常工作中不可或缺的一部分。想象一下这样的场景:你的应用需要同时处理来自YAML文件的默认配置、环境变量中的部署特定设…...

别只盯着Stegsolve了!用Python+PIL+TweakPNG,我手动拆解了这道PNG隐写CTF题

从二进制到像素:手工拆解PNG隐写的艺术与技术 在CTF竞赛和数字取证领域,PNG图像隐写一直是个经久不衰的话题。当大多数人习惯性地打开Stegsolve这类自动化工具时,我们是否思考过这些黑箱背后的运作原理?本文将带你深入PNG文件格式…...

别再乱删系统服务了!详解Windows Update(wuauserv)与更新推送(usosvc)对Modern Standby的影响与正确禁用方法

Modern Standby与系统服务的平衡艺术:Windows更新服务的精细管控指南 当你的笔记本电脑在合盖后依然发烫耗电,风扇声如同直升机起飞,这很可能是Modern Standby在"帮倒忙"。作为Windows 10/11引入的新型待机技术,Modern…...

LX Music桌面版:打破音乐平台壁垒的技术实践

LX Music桌面版:打破音乐平台壁垒的技术实践 【免费下载链接】lx-music-desktop 一个基于 Electron 的音乐软件 项目地址: https://gitcode.com/GitHub_Trending/lx/lx-music-desktop 在当今数字音乐时代,用户经常面临一个困境:喜欢的…...

Clion远程开发环境配置:解决头文件缺失与DEBUG断点失效问题

1. 解决Clion远程开发头文件缺失问题 第一次用Clion连远程服务器开发C项目时,最崩溃的就是明明本地代码没报错,一同步到远程就满屏红色波浪线。这种头文件缺失问题我遇到过太多次了,根本原因在于Clion的远程工具链(Remote Toolch…...

NATAPP 隧道连接与常见故障排查实战指南

1. NATAPP 隧道连接基础与常见错误类型 第一次接触NATAPP的朋友可能会觉得隧道连接是个复杂的概念,其实它就像是在你家和外界之间搭了一座桥。我刚开始用的时候也踩过不少坑,后来才发现大多数问题都有规律可循。NATAPP的核心功能就是帮我们把本地服务暴…...

生存分析实战:Harrell’s C-index 评估模型预测一致性的核心原理与应用

1. 生存分析中的C-index到底是什么? 第一次接触Harrells C-index这个概念时,我也是一头雾水。记得当时在分析癌症患者的生存数据,导师突然问我:"你这个模型的C-index是多少?"我支支吾吾答不上来&#xff0c…...

Element UI多选下拉框el-select数据回显的实战技巧与类型转换

1. 多选下拉框数据回显的核心问题 在实际开发中,使用Element UI的el-select组件实现多选功能时,经常会遇到数据回显失败的情况。最常见的问题就是明明后端已经返回了数据,但下拉框中却无法正确显示已选项。这种情况往往让人抓狂,特…...

YOLO-v8.3快速体验:免费镜像+GPU按需计费,轻松上手物体检测

YOLO-v8.3快速体验:免费镜像GPU按需计费,轻松上手物体检测 想体验最先进的物体检测技术却苦于环境配置复杂?本文将带你通过预置镜像快速部署YOLO-v8.3,结合按需GPU计费方案,让你零门槛入门计算机视觉领域。无需繁琐的…...

SUNFLOWER MATCH LAB for .NET Developers: Integrating Plant Recognition into C# Applications

SUNFLOWER MATCH LAB for .NET Developers: Integrating Plant Recognition into C# Applications 最近在做一个户外科普应用,需要识别用户随手拍的各种花花草草。找了一圈,发现基于深度学习的植物识别模型效果不错,但怎么把它集成到咱们熟悉…...

MinerU镜像新手教程:环境零配置,快速体验视觉多模态PDF解析

MinerU镜像新手教程:环境零配置,快速体验视觉多模态PDF解析 1. 引言:为什么选择MinerU镜像 PDF文档解析一直是办公自动化和知识管理中的痛点问题。传统工具在处理复杂排版、表格和公式时往往力不从心,而搭建专业的AI解析环境又需…...