当前位置: 首页 > article >正文

TIGER: A Generative Approach to Semantic ID-Based Recommender Systems

1. 推荐系统的新革命生成式语义ID推荐系统早已渗透进我们生活的方方面面从电商平台的猜你喜欢到视频网站的推荐观看背后都离不开推荐算法的支持。但传统推荐系统存在一个根本性痛点它们通常采用两阶段架构先通过召回模型筛选候选集再用排序模型进行精排。这种架构不仅复杂还面临着冷启动和多样性不足的挑战。TIGER框架的出现彻底改变了这一局面。它创新性地提出了单阶段生成式检索的范式就像让推荐系统学会了说话一样直接生成下一个可能感兴趣的物品标识。这种突破性的思路来源于一个简单却深刻的观察为什么不能让推荐系统像人类语言一样用有意义的词语来表达物品呢想象一下当你在书店找书时店员不会给你一堆随机编号而是会说最新出版的科幻小说或获得雨果奖的作品。TIGER的语义ID正是借鉴了这一思路为每个物品生成具有语义含义的编码元组。比如一部电影可能被编码为(动作,科幻,漫威)而一本书可能是(文学,诺贝尔奖,日本作家)。这种编码方式不仅更符合人类思维还能显著提升推荐的相关性。2. TIGER框架的核心技术解析2.1 语义ID的生成艺术TIGER框架的第一个核心技术突破是语义ID生成。这个过程就像给每个物品起一个学名而不是随机分配一个编号。具体实现上它采用了RQ-VAE残差量化变分自编码器这一创新方法。让我用一个生活中的例子来解释RQ-VAE的工作原理假设你要描述一个人的外貌。传统方法可能直接给出身高175cm体重65kg这样的精确数值。而RQ-VAE则采用分层描述先确定是亚洲人第一级然后是中等身材第二级接着是圆脸第三级最后是戴眼镜第四级。这种从粗到细的描述方式既保留了关键特征又大大降低了复杂度。在实际操作中TIGER首先使用预训练的Sentence-T5模型将物品的文本描述如标题、类别等转换为768维的语义嵌入。然后通过RQ-VAE的三级量化生成3个码字组成的语义ID。为了避免冲突还会追加一个唯一标识码最终形成4码字的完整语义ID。这种设计使得编码表大小仅为1024256×4远小于传统推荐系统动辄上亿的嵌入表。2.2 生成式检索的魔法有了语义ID后TIGER的第二个核心技术是生成式检索模型。这里它采用了基于Transformer的序列到序列架构但做了几个关键改进个性化输入设计模型输入不仅包含用户历史交互物品的语义ID序列还加入了用户ID的哈希表示。这就像在对话中既考虑用户过去的喜好又记住用户是谁。精简的词汇表与传统NLP模型动辄数万的词汇表不同TIGER只需处理1024个语义码字和2000个用户token大大降低了模型复杂度。层次化解码模型可以灵活控制生成粒度比如只关注前几个码字进行粗粒度推荐或生成完整ID进行精准推荐。这就像可以先推荐科幻类电影再细化到近三年的硬科幻作品。实测表明这种生成式方法在Amazon数据集上的表现显著优于传统方案在Beauty类别上NDCG5指标比SASRec提升了29%在Toys and Games类别上NDCG5和NDCG10分别提升了21%和15%。3. 突破传统局限的两大优势3.1 冷启动问题的优雅解法冷启动是推荐系统最头疼的问题之一。传统方法对新物品束手无策因为它们没有用户交互数据来学习嵌入表示。而TIGER的语义ID天生就是为解决这个问题设计的。举个例子当一款新手机上市时传统系统要等足够多用户与之交互后才能准确推荐。但TIGER可以直接分析它的描述如旗舰手机、1英寸大底相机、骁龙8处理器生成语义ID立即融入推荐系统。实验显示在模拟5%新物品的场景下TIGER的RecallK指标全面优于基于语义KNN的基线方法。这种能力源于语义ID的本质它不依赖用户行为数据而是基于物品自身内容特征。就像一个有经验的店员即使没见过某本新书也能根据它的题材、作者和内容简介做出合理推荐。3.2 多样性与相关性的平衡术推荐系统另一个常见问题是信息茧房——反复推荐相似内容。TIGER通过语义ID的层次化结构和温度采样实现了精准控制推荐多样性的能力。具体来说调整温度参数可以控制生成过程的随机性。更高的温度会使模型更倾向于探索不同类别的物品而较低温度则保持精准推荐。更妙的是TIGER可以在不同层级上应用温度采样在第一码字上提高温度会增加跨类别多样性而在后续码字上调整则保持主类别不变的情况下增加细分多样性。实测数据显示通过合理设置温度参数TIGER能在保持推荐准确率的同时将类别分布的熵值多样性指标提升2-3倍。这就像一位既了解你核心兴趣又能适时引入新鲜内容的智能顾问。4. 实战中的技术细节与调优4.1 RQ-VAE的训练技巧在实际部署TIGER时RQ-VAE的训练质量直接决定语义ID的效果。经过多次实验我总结了几个关键点码本初始化直接随机初始化容易导致码本坍塌多数输入映射到少数码字。采用k-means聚类初始化能显著改善这一问题使码本使用率超过80%。残差连接设计RQ-VAE的多级量化需要精心设计残差路径。实践中发现在编码器末端加入Layer Normalization能稳定训练过程。损失函数配比重建损失与量化损失的比例Ψ需要调优。过大如0.5会导致码字缺乏区分度过小如0.1则可能损害重建质量。0.25是个不错的起点。# RQ-VAE训练代码示例 def train_step(batch): # 获取语义嵌入 content_emb sentence_t5(batch[content]) # RQ-VAE前向传播 quantized, codes, losses rq_vae(content_emb) # 组合损失 recon_loss mse_loss(quantized, content_emb) total_loss recon_loss 0.25 * losses[quant_loss] # 反向传播与优化 optimizer.zero_grad() total_loss.backward() optimizer.step()4.2 序列模型的工程优化生成式推荐模型的推理延迟是需要特别关注的问题。相比传统ANN检索自回归解码确实需要更多计算资源。通过以下优化可以将延迟控制在可接受范围层级剪枝在beam search过程中对低概率的码字路径进行早期剪枝。特别是前几个码字的选择对最终结果影响最大可以设置更严格的剪枝阈值。缓存机制用户历史序列的编码结果可以缓存只需对新交互进行增量更新。这在实时推荐场景下能大幅减少计算量。量化部署将FP32模型量化为INT8在保持95%以上准确率的同时推理速度提升2-3倍。这对生成式模型特别重要因为每个token生成都需要完整的前向传播。提示在实际部署时建议从较小的beam size如5-10开始逐步增加直到性能不再显著提升。过大的beam size不仅增加延迟还可能降低推荐质量。5. 超越电商的应用前景虽然TIGER最初在电商推荐场景中验证但其技术思路具有广泛的适用性。我在多个领域的实验中发现了令人振奋的可能性内容推荐领域新闻、视频等内容具有丰富的文本描述非常适合语义ID生成。实测将TIGER应用于新闻推荐时冷启动文章的CTR提升了40%。社交网络推荐将用户画像和社交关系编码为语义ID可以生成更精准的好友和群组推荐。特别是在新兴社交平台中能快速适应新用户的加入。物联网场景智能家居设备产生的时序数据可以被视为一种交互序列。TIGER能够学习设备使用模式预测用户下一步可能需要的服务。这些跨领域应用的成功印证了生成式语义ID作为一种通用推荐范式的潜力。它打破了传统推荐系统对历史交互数据的重度依赖开辟了一条更灵活、更智能的推荐新路径。在技术演进的道路上TIGER代表了一个重要转折点——推荐系统从匹配走向了生成。这种转变不仅仅是技术实现的变化更是对推荐本质的重新思考。当推荐系统能够像人类一样用有意义的语言表达物品和需求时我们离真正的智能推荐就更近了一步。

相关文章:

TIGER: A Generative Approach to Semantic ID-Based Recommender Systems

1. 推荐系统的新革命:生成式语义ID 推荐系统早已渗透进我们生活的方方面面,从电商平台的"猜你喜欢"到视频网站的"推荐观看",背后都离不开推荐算法的支持。但传统推荐系统存在一个根本性痛点:它们通常采用两阶…...

translategemma-12b-it效果展示:图片翻译准确率实测分享

translategemma-12b-it效果展示:图片翻译准确率实测分享 1. 模型核心能力概览 translategemma-12b-it是Google基于Gemma 3架构开发的开源多语言翻译模型,其最突出的特点是实现了图片到文本的端到端翻译能力。与传统的"OCR识别文本翻译"两段式…...

从零开始:用Ollama在个人电脑上运行EmbeddingGemma-300M

从零开始:用Ollama在个人电脑上运行EmbeddingGemma-300M 1. 为什么选择EmbeddingGemma-300M 如果你正在寻找一个既轻量又强大的文本嵌入模型,EmbeddingGemma-300M值得你关注。这个由谷歌DeepMind团队开发的模型仅有3亿参数,量化后体积不到2…...

SAM掩码生成避坑指南:从参数调优到后处理的全流程实战

SAM掩码生成避坑指南:从参数调优到后处理的全流程实战 当第一次看到SAM生成的掩码边缘出现锯齿状毛刺,或是发现关键物体被分割成碎片时,我意识到参数调整和后处理的重要性。本文将分享如何通过精细控制points_per_side、stability_score_thre…...

从案例学习Verilog for循环:如何高效实现信号赋值与多路选择器

Verilog for循环实战:从信号赋值到多路选择器的工程化实现 1. 硬件描述语言中的循环思维 在软件编程中,for循环是最基础的控制结构之一,但在硬件描述语言(HDL)如Verilog中,循环的使用却需要完全不同的思维方式。硬件工程师必须时刻…...

Windows平台VVC视频编码实战:VTM10.0环境搭建与性能调优指南

1. 为什么选择VVC和VTM10.0 视频编码技术这几年发展飞快,从H.264到HEVC再到现在的VVC(Versatile Video Coding),每一次迭代都能带来接近50%的压缩率提升。VVC作为最新的国际视频编码标准,在4K/8K、HDR、360度全景视频等…...

Qwen3-14b_int4_awq保姆级教程:Chainlit消息流式渲染与Markdown支持

Qwen3-14b_int4_awq保姆级教程:Chainlit消息流式渲染与Markdown支持 1. 模型简介 Qwen3-14b_int4_awq是基于Qwen3-14b模型的int4量化版本,采用AWQ(Activation-aware Weight Quantization)技术进行压缩优化。这个量化版本通过Ang…...

Qwen3-4B写作大师功能全解析:除了写代码,还能做什么实用任务?

Qwen3-4B写作大师功能全解析:除了写代码,还能做什么实用任务? 1. 超越代码生成的全能写作助手 当大多数人听到"AI写作"时,第一反应往往是"自动生成代码"。确实,Qwen3-4B-Instruct在代码生成方面…...

STM32F103C8T6最小系统板驱动开发:为部署轻量AI模型做准备

STM32F103C8T6最小系统板驱动开发:为部署轻量AI模型做准备 你是不是也想过,能不能让一块小小的、几十块钱的蓝色小板子跑起来AI模型?我说的就是那个在电子爱好者圈子里几乎人手一块的“蓝色药丸”——STM32F103C8T6最小系统板。它核心的Cort…...

translategemma-4b-it多场景延伸:结合Whisper实现音视频字幕+画面图文翻译

translategemma-4b-it多场景延伸:结合Whisper实现音视频字幕画面图文翻译 1. 引言:从图文翻译到音视频全栈处理 想象一下这个场景:你拿到一段英文技术分享视频,想快速了解内容,但字幕是英文的,画面里偶尔…...

清音听真Qwen3-ASR-1.7B在科研场景应用:学术讲座→参考文献自动提取

清音听真Qwen3-ASR-1.7B在科研场景应用:学术讲座→参考文献自动提取 1. 科研场景的语音识别痛点 学术研究者经常面临这样的困境:参加完一场精彩的学术讲座,收获了大量宝贵信息,但回顾时却发现很多关键内容和参考文献难以准确记录…...

一键下载Markdown:深求·墨鉴完整使用流程演示

一键下载Markdown:深求墨鉴完整使用流程演示 1. 产品介绍与核心价值 深求墨鉴(DeepSeek-OCR-2)是一款融合传统美学与现代AI技术的文档解析工具。不同于传统OCR软件的冰冷界面,它将水墨艺术元素融入交互设计,让文档数…...

Lingbot-Depth-Pretrain-Vitl-14 工业检测应用:零件安装深度合规性检查

Lingbot-Depth-Pretrain-Vitl-14 工业检测应用:零件安装深度合规性检查 在一条繁忙的装配线上,质检员小王正拿着游标卡尺,弯腰检查每一个产品上螺丝的拧入深度。这项工作枯燥、重复,而且人眼判断总有误差,稍不留神就可…...

PROJECT MOGFACE在网络安全领域的应用:模拟攻击与自动化漏洞报告生成

PROJECT MOGFACE在网络安全领域的应用:模拟攻击与自动化漏洞报告生成 最近和几个做安全的朋友聊天,大家普遍有个感觉:活儿越来越多,但人手总是不够。每天面对海量的日志、层出不穷的漏洞公告、还有永远写不完的渗透测试报告&…...

Qwen3-VL-8B保姆级教程:3步搞定图文对话AI,零基础5分钟上手

Qwen3-VL-8B保姆级教程:3步搞定图文对话AI,零基础5分钟上手 你是不是经常遇到这样的场景:看到一张图片,想知道里面有什么内容;收到一张截图,想快速提取里面的文字信息;或者想开发一个能看懂图片…...

Qwen3-14B开源大模型应用:Qwen3-14b_int4_awq构建跨境电商多语言客服系统

Qwen3-14B开源大模型应用:Qwen3-14b_int4_awq构建跨境电商多语言客服系统 1. 技术背景与模型介绍 Qwen3-14b_int4_awq是基于Qwen3-14B大模型的优化版本,采用了int4精度和AWQ(Adaptive Weight Quantization)量化技术。这个版本通…...

Mirage Flow运维指南:Linux系统监控、日志管理与高可用部署

Mirage Flow运维指南:Linux系统监控、日志管理与高可用部署 最近有不少朋友在部署了Mirage Flow模型后,跑来问我:“模型跑起来了,但怎么知道它现在健不健康?万一挂了怎么办?” 这确实是生产环境里最实际的…...

Stable Yogi Leather-Dress-Collection 开发环境配置:从 Anaconda 虚拟环境到项目运行

Stable Yogi Leather-Dress-Collection 开发环境配置:从 Anaconda 虚拟环境到项目运行 最近有不少朋友在尝试运行 Stable Yogi 这类图像生成模型时,遇到了各种依赖包冲突、版本不匹配的麻烦。明明跟着教程一步步走,结果运行时报错&#xff0…...

Ostrakon-VL-8B硬件检测助手:媲美图拉丁吧的AI装机指导

Ostrakon-VL-8B硬件检测助手:媲美图拉丁吧的AI装机指导 每次打开机箱,看着里面密密麻麻的线缆和各式各样的硬件,你是不是也感到一阵头大?想升级电脑,却分不清哪个是显卡、哪个是内存条,更别提判断它们之间…...

解锁产品创新新视角:深入浅出形态分析法

您是否曾经感到思维卡壳,在为新产品或服务构思时,不论如何脑暴,都只能在已有的想法周围打转?在激烈的市场竞争中,仅仅依靠偶尔的灵感闪现往往是不够的。我们需要一种系统化的方法,来有条不紊地探索所有可能…...

产品经理必知:KANO模型,帮你搞懂用户到底想要什么?

做产品,最怕的就是费心费力做出的新功能,用户根本不买账。你是不是也遇到过这种情况:为了上线一个“高大上”的新功能,团队加班加点一个月,结果上线后数据凄凄惨惨?用户嘴上说着“我想要这个”,…...

SiameseUIE完整指南:test.py可扩展性设计——支持批量文本处理改造

SiameseUIE完整指南:test.py可扩展性设计——支持批量文本处理改造 1. 为什么需要改造test.py? SiameseUIE镜像开箱即用,但原始test.py只面向单次验证场景:它内置5个固定测试样例,逐条运行、逐条打印结果&#xff0c…...

把云盘都装进一个篮子里:Openlist 部署详细指南

前言 你有没有遇到过这样的烦恼:手机里装着阿里云盘、百度网盘、夸克,甚至还有自己家里 NAS 上的文件,每次找个东西都要在几个 App 之间来回切换。想搭个简单的分享页面,又觉得搞个专门的网盘系统太重了。 Openlist 就是为了解决…...

《LeetCode 顺序刷题》51 - 60

51、[困难] N 皇后 位运算 哈希表 class Solution { private:bool checkCol[10], checkDig1[20], checkDig2[20];vector<vector<string>> ret;vector<string> path;int num;void dfs(int row) {if (row num) {ret.push_back(path);return;}for (int col …...

Phi-3-vision-128k-instruct部署案例:边缘设备(Jetson Orin)轻量化适配尝试

Phi-3-vision-128k-instruct部署案例&#xff1a;边缘设备&#xff08;Jetson Orin&#xff09;轻量化适配尝试 1. 模型简介 Phi-3-Vision-128K-Instruct 是一款轻量级的多模态模型&#xff0c;属于Phi-3系列的最新成员。这个模型特别适合在边缘计算设备上运行&#xff0c;因…...

Phi-3-vision-128k-instruct部署案例:高校AI实验室多模态教学平台搭建

Phi-3-vision-128k-instruct部署案例&#xff1a;高校AI实验室多模态教学平台搭建 1. 项目背景与模型介绍 Phi-3-Vision-128K-Instruct是微软推出的轻量级多模态模型&#xff0c;专为图文对话场景优化设计。作为Phi-3模型家族成员&#xff0c;它支持长达128K的上下文窗口&…...

蓝桥杯(排序)

下面介绍几种常用的排序方法以P1177模板题为例&#xff08;1&#xff09;插入排序将数组第一个元素化为已排序区间 从第 2 个元素&#xff08;未排序区间第一个&#xff09;开始&#xff0c;逐个取出元素作为待插入元素 将待插入元素与前面已排序区间的元素从后往前作比较若已排…...

计算机毕业设计springboot面向移动端的线上作业系统的设计与实现App 基于Spring Boot的移动端在线作业管理系统的设计与开发 面向移动设备的线上作业系统开发:基于Spring Boot

计算机毕业设计springboot面向移动端的线上作业系统的设计与实现App_t6302 &#xff08;配套有源码 程序 mysql数据库 论文&#xff09; 本套源码可以在文本联xi,先看具体系统功能演示视频领取&#xff0c;可分享源码参考。随着移动互联网的快速发展&#xff0c;传统的教学模式…...

Python全栈入门到实战【基础篇 13】复合数据类型:字典(键值映射)与集合(无序去重)

前言 哈喽各位小伙伴!前面咱们学了字符串、数字这些基础类型,也掌握了列表这种有序序列——但实际开发中,仅靠这些还不够: 想存储“姓名-年龄-手机号”这种“键值对应”的用户信息,用列表只能按位置存([“张三”, 20, “13812345678”]),查手机号要记索引,极不方便;…...

Qwen3-Reranker-0.6B基础教程:1.2GB模型文件完整性校验(sha256)方法

Qwen3-Reranker-0.6B基础教程&#xff1a;1.2GB模型文件完整性校验&#xff08;sha256&#xff09;方法 1. 为什么需要校验模型文件完整性 当你下载Qwen3-Reranker-0.6B这个1.2GB的大文件时&#xff0c;可能会遇到各种问题&#xff1a;网络中断导致下载不完整、存储设备故障造…...