当前位置: 首页 > article >正文

搜索广告算法工程师大模型学习--1.计划

大模型时代搜索广告算法专家理论与数学重构进阶计划前置约束与学习定调核心目标从传统 NLP 分类思维彻底向大模型生成式思维Generative与搜索广告业务思维Ranking/Retrieval转型。学习风格抛弃浅尝辄止拒绝实践调参。直击底层数学公式推导、模型架构差异与目标函数Loss设计。时间规划无强制时间表按“阶段目标”稳步推进。阶段一Transformer 及核心演进理论重构 焦点与目标找回 Transformer 的底层直觉并掌握大模型时代对原生 Transformer 的几项关键数学改造。理解为什么现在的模型长这样以及它们为了解决什么计算瓶颈。学习顺序与核心文献1. 原生 Transformer 的数学拆解核心关注Self-Attention 的Q K T / d k QK^T/\sqrt{d_k}QKT/dk​​缩放意义、FFN 层的升降维逻辑、Residual 与 LayerNorm 对梯度的影响。精读文献Attention Is All You Need (NeurIPS 2017)优质讲解The Illustrated Transformer (Jay Alammar) / 知乎翻译版图解 TransformerTransformer 的数学原理与公式推导知乎2. 位置编码的革命RoPE (Rotary Position Embedding)核心关注从绝对位置编码到相对位置的转换。理解欧拉公式e i θ e^{i\theta}eiθ在注意力机制中的旋转矩阵推导以及它如何保持平移不变性。精读文献RoFormer: Enhanced Transformer with Rotary Position Embedding (2021)优质讲解十分钟读懂旋转位置编码RoPE苏剑林 科学空间RoPE 旋转位置编码推导与图解知乎3. 显存优化与推理加速KV Cache 与 Attention 变体核心关注MHA (Multi-Head) - MQA (Multi-Query) - GQA (Grouped-Query)。理解 KV Cache 的显存占用计算公式2 × b × s × h × d 2 \times b \times s \times h \times d2×b×s×h×d。精读文献GQA: Training Generalized Multi-Query Attention Models from Checkpoints (2023)优质讲解大模型推理加速看懂 KV Cache 与 MQA/GQA知乎LLM 推理核心技术原理KV Cache 深入理解4. 激活函数与归一化的进化核心关注为什么用 SwiGLU 替代 ReLU (S w i s h ( x W ) ⊗ x V Swish(xW) \otimes xVSwish(xW)⊗xV)为什么用 RMSNorm 替代 LayerNorm去掉均值计算的数学考量。精读文献GLU Variants Improve Transformer (2020)优质讲解RMSNorm 与 LayerNorm 的对比及推导知乎大模型基础SwiGLU 激活函数详解阶段二通用大模型生态与架构演进 (General LLM Ecosystem) 焦点与目标深入四大主流模型Llama, Qwen, DeepSeek, GLM的底层差异。理解不同模型在架构、注意力机制优化、以及混合专家MoE技术上的不同数学选择。学习顺序与核心文献1. 架构标杆的演进轨迹Llama 体系 (仅查阅关键历史拐点)核心关注Llama 1 的开创性架构RoPE SwiGLU RMSNormLlama 2 的 GQA 引入Llama 3 的大规模数据配比与 Tiktoken 词表优化。精读文献LLaMA: Open and Efficient Foundation Language Models (Llama 1, 2023)The Llama 3 Herd of Models (Llama 3, 2024)优质讲解深入浅出 LLaMA 架构与论文精读知乎Llama 3 论文超硬核拆解它到底强在哪里知乎2. 阿里开源双壁Qwen 技术架构核心关注Qwen 的双词表设计多语言代码长文本 RoPE 外推机制YARN / Dynamic NTK-aware以及其 Dense 架构下的缩放定律Scaling Law。精读文献Qwen Technical Report (2023 最新版报告)优质讲解Qwen 架构与技术原理解析知乎专栏3. 极致性价比与创新DeepSeek (MoE 与 MLA)核心关注DeepSeekMoE 的架构原理共享专家 Shared Expert 细粒度路由Router 的 Load Balancing Loss 设计。DeepSeek-V2/V3 中的 MLA (Multi-head Latent Attention) 如何通过低秩投影Low-Rank Projection极大地压缩 KV Cache。精读文献DeepSeekMoE: Towards Ultimate Expert Specialization in MoE (2024)DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model (2024 - 关注 MLA 部分)优质讲解万字长文解析 DeepSeek MoE 与 Load Balancing (知乎)硬核推导DeepSeek-V2 MLA 到底是怎么压缩 KV Cache 的知乎4. 自回归与双向的折中GLM 架构 (ChatGLM/GLM-4)核心关注Autoregressive Blank Infilling 目标2D 位置编码机制。了解这种架构在长文本和特定任务上的理论优势。精读文献GLM-4 Technical Report (2024)阶段三对齐 (Alignment) 与推理强化 (Reasoning) 焦点与目标掌握模型如何从“续写机器”变成“听指令的助手”甚至“推理专家”。吃透 RLHF、DPO 的损失函数推导以及 DeepSeek-R1 带来的纯强化学习GRPO数学范式。学习顺序与核心文献1. 奖励模型与传统强化学习RLHF 体系核心关注Bradley-Terry 模型奖励函数的数学定义P ( y w y l ) σ ( r ( y w ) − r ( y l ) ) P(y_w y_l) \sigma(r(y_w) - r(y_l))P(yw​yl​)σ(r(yw​)−r(yl​))PPOProximal Policy Optimization的 Actor-Critic 架构与 KL 散度约束项。精读文献InstructGPT / Training language models to follow instructions with human feedback (2022)优质讲解强化学习 RLHFInstructGPT 论文硬核解析知乎ChatGPT 技术原理解析PPO 算法与 KL 惩罚项推导2. 损失函数的数学优雅DPO (Direct Preference Optimization)核心关注DPO 如何通过数学推导解方程将复杂的 PPO 目标直接转化为针对 LLM 的二分类交叉熵 Loss。掌握 DPO Loss 公式推导过程这是目前最常用的对齐方法。精读文献Direct Preference Optimization: Your Language Model is Secretly a Reward Model (2023)优质讲解DPO (Direct Preference Optimization) 数学推导与直觉解析知乎RLHF 终结者深入理解 DPO 损失函数科学空间3. System 2 思考与纯 RL 范式突破DeepSeek-R1 与 GRPO核心关注无需 SFT完全依靠规则驱动的强化学习。掌握 GRPO (Group Relative Policy Optimization) 的公式计算如何通过同一 Prompt 采样多个输出计算相对 Advantage (归一化)从而省去 Critic 模型的显存开销。精读文献DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (2025)优质讲解DeepSeek-R1 论文精读GRPO 算法核心公式推导知乎 (注需关注最新的 DeepSeek R1 算法解析文章)告别 Critic 模型GRPO (Group Relative Policy Optimization) 原理解读 (基于 DeepSeekMath)阶段四搜索广告核心漏斗与生成式大模型前沿 焦点与目标深入理解搜索广告搜推广的漏斗体系召回-粗排-精排-机制。从传统的点击率预估CTR架构过渡到大模型时代 Generative Retrieval生成式召回的前沿数学范式。学习顺序与核心文献1. 经典广告系统的基石与漏斗核心关注双塔模型Dual-Tower中的内积计算与 ANN (近似最近邻) 的数学边界。特征交叉的演进DCN 的x l 1 x 0 x l T w l b l x l x_{l1} x_0 x_l^T w_l b_l x_lxl1​x0​xlT​wl​bl​xl​。精读文献Deep Neural Networks for YouTube Recommendations (2016 双塔启发)Deep Cross Network for Ad Click Predictions (DCN, 2017)优质讲解YouTube DNN 经典论文与双塔模型原理解析知乎特征交叉系列DCN (Deep Cross Network) 原理推导2. 用户行为序列与注意力机制核心关注DIN 提出时的背景。Target Attention 如何通过目标广告 (Target Ad) 对用户的历史点击序列计算 Attention实现千人千面的表示表示精读文献Deep Interest Network for Click-Through Rate Prediction (DIN, 2018)优质讲解阿里妈妈 CTR 预估经典DIN 论文精读与 Attention 机制知乎3. 【前沿核心】大模型在召回层的革命Generative Retrieval核心关注彻底颠覆“双塔ANN”的检索范式。Item ID 如何被 Token化Semantic IDRQ-VAE 在其中的离散表征作用。自回归模型如何直接计算P ( I t e m ∣ U s e r , C o n t e x t ) P(Item | User, Context)P(Item∣User,Context)TIGER 与 GR4AD 的 LazyAR 机制推导。精读文献TIGER: Transformer Index for GEnerative Recommenders (2023, 奠基之作)Generative Retrieval for Ad Generation and Recommendation (GR4AD, 腾讯等 2024)优质讲解推荐系统新范式生成式召回 (Generative Retrieval) 原理剖析知乎深入浅出 RQ-VAE 与 Semantic ID 在生成式推荐中的应用4. LLM for CTR 预估精排/重排核心关注LLM 在精排中的局限性时延问题。大模型如何处理纯表格类特征Tabular Data。位置偏差Position Bias在 LLM Prompt 中的表现与消除。大模型到小模型Teacher - Student的 Knowledge Distillation知识蒸馏在工业界的应用数学考量。延伸查阅 (可选)搜索 “LLM for CTR prediction survey” 获取最新的综述了解工业界目前的通用架构模式。

相关文章:

搜索广告算法工程师大模型学习--1.计划

大模型时代搜索广告算法专家:理论与数学重构进阶计划 前置约束与学习定调: 核心目标:从传统 NLP 分类思维彻底向大模型生成式思维(Generative)与搜索广告业务思维(Ranking/Retrieval)转型。学…...

3分钟看懂无人机飞行日志:免费在线工具让数据说话

3分钟看懂无人机飞行日志:免费在线工具让数据说话 【免费下载链接】UAVLogViewer An online viewer for UAV log files 项目地址: https://gitcode.com/gh_mirrors/ua/UAVLogViewer 还在为看不懂无人机飞行日志而烦恼吗?那些密密麻麻的数据、复杂…...

下载视频不如用Via,一分都不花

找了很长时间,没想到竟然这么简单,为啥早没发现呢! 工具的名称叫Via浏览器是个App,没错在安卓手机或平板运行的工具。 缺点:pc下用不了,有些视频下不了,如爱奇艺等。苹果手机是否能用不知道,自己试吧。 优点:操作方便、简单,即使你是小白也能熟练操作。免费,一分…...

提示工程:从AI调教到结构化沟通的系统方法论

1. 项目概述:从“咒语”到“工程”的思维跃迁最近在GitHub上看到一个挺有意思的项目,叫“Hazrat-Ali9/Prompt-Engineering”。乍一看,这名字有点神秘,但点进去你会发现,它其实是一个关于“提示工程”的资源集合。这让我…...

华硕游侠2-RX键盘多功能滚轮自定义M失效的解决方案

新买了一块游侠2 rx键盘,想着用自定义滚轮方便打开常用程序,但是发现在Armoury Crate中设置后不起作用,网上解决方案伤筋动骨,得不偿失,有一定风险。 经测试,自定义滚轮能正常执行宏定义,只是对…...

C++内存可视化利器:silicondawn/memory-viewer库实战指南

1. 项目概述与核心价值最近在调试一个涉及复杂内存操作的C项目时,我又一次陷入了“内存黑盒”的困境。指针指向的数据结构到底对不对?序列化后的字节流里某个字段的值是不是我预期的?手动printf或者断点查看十六进制,效率低不说&a…...

Visual C++运行库终极修复指南:一键解决“缺少DLL文件“的完整解决方案

Visual C运行库终极修复指南:一键解决"缺少DLL文件"的完整解决方案 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经在打开某个软…...

SpringBoot+Vue民宿管理系统源码+论文

代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹 分享万套开题报告任务书答辩PPT模板 作者完整代码目录供你选择: 《SpringBoot网站项目》1800套 《SSM网站项目》1500套 《小程序项目》1600套 《APP项目》1500套 《Python网站项目》…...

Go语言WebSocket服务器tocket:轻量级高性能实时通信方案

1. 项目概述:一个轻量级、高性能的WebSocket服务器 最近在折腾一个需要实时双向通信的物联网项目,传统的HTTP轮询方案在延迟和服务器开销上都不太理想,WebSocket自然就成了首选。在技术选型时,我习惯性地会去GitHub上搜罗一番&…...

基于Claude的代码库感知工具:智能编程助手的设计与实战

1. 项目概述:当Claude遇上代码库,一个智能编程助手的诞生最近在GitHub上看到一个挺有意思的项目,叫openclaw-claude-code。光看名字,你可能会觉得这又是一个基于某个大语言模型的代码生成工具,但实际深入了解后&#x…...

论文详解:考虑人类移动日常节律的动态社区检测

论文详解:考虑人类移动日常节律的动态社区检测 文章目录 论文详解:考虑人类移动日常节律的动态社区检测 1. 论文基本信息 2. 摘要与核心贡献 2.1 研究背景 2.2 研究方法 2.3 核心贡献 3. 研究背景与问题提出 3.1 城市空间结构研究的重要性 3.2 传统静态社区检测的局限性 3.3 …...

告别静态图表!用C# Winform Chart控件打造实时刷新的数据监控面板(附完整源码)

用C# Winform Chart控件构建高并发实时数据监控系统 在工业自动化、金融交易和物联网领域,实时数据可视化是决策者最依赖的"眼睛"。传统静态图表早已无法满足毫秒级数据更新的需求,而基于Web的解决方案又常常面临延迟高、部署复杂的困扰。本文…...

强化学习优化文本生成:从原理到实战,打造可控AI创作工具

1. 项目概述:当强化学习遇上文本生成如果你玩过AI绘画,一定对“提示词工程”不陌生——通过精心设计的文字描述,让模型画出你想要的画面。但你是否想过,这个过程本身也可以被“优化”?比如,你希望模型生成一…...

开发者技能图谱实战指南:从碎片化学习到系统性成长

1. 项目概述:一个面向开发者的技能图谱与实战指南最近在GitHub上看到一个挺有意思的项目,叫moltoffer/moltoffer-skills。光看名字,你可能会觉得这又是一个“面试宝典”或者“八股文合集”。但当我点进去仔细研究后,发现它的定位远…...

AI Agent工作流引擎:从DAG编排到生产级应用实践

1. 项目概述:AI Agent工作流引擎的诞生与价值最近在GitHub上看到一个挺有意思的项目,叫“ai-agent-workflow”。光看名字,你可能觉得这又是一个关于AI智能体的框架,但仔细研究它的代码和设计理念,你会发现它瞄准的是一…...

Java 枚举类型:3个经典应用场景与实战案例

Java 枚举类型:3个经典应用场景与实战案例枚举( enum )是 Java 中一种特殊的类,它通过固定的常量集合来表示有限且离散的状态,不仅能提升代码可读性,还能避免魔法值、减少错误,是后端开发中非常…...

基于APScheduler的定时提醒服务设计与Python实现

1. 项目概述与核心价值最近在折腾一个名为rogerwus/Noonwake_test的项目,这名字乍一看有点神秘,像是某个内部测试或者个人实验性质的仓库。作为一名常年泡在代码仓库里的开发者,我对这类项目标题背后的故事和技术探索总是充满好奇。经过一番深…...

Clawless框架:构建合规网页数据抓取系统的设计哲学与实践指南

1. 项目概述与核心价值最近在GitHub上闲逛,发现了一个名为“Clawless”的项目,作者是HainanZhao。这个项目名挺有意思,“Clawless”直译是“无爪”,听起来像是一个温和无害的工具。点进去一看,发现它是一个用于自动化处…...

开源RPA工具Clawless:本地化低代码自动化实战与核心原理

1. 项目概述:从“无爪”到“有手”,一个开源RPA项目的诞生最近在GitHub上闲逛,发现了一个挺有意思的项目,叫“Clawless”,直译过来是“无爪”。初看这个标题,你可能会有点摸不着头脑,这跟自动化…...

基于本地大语言模型与小米设备协议构建私有化智能家居AI控制中枢

1. 项目概述:一个为小米设备打造的本地化AI大脑最近在折腾智能家居,特别是小米生态链的设备,发现一个挺有意思的痛点:虽然小爱同学用起来很方便,但很多高级的、定制化的智能场景,要么得在米家App里做复杂的…...

Vibeproxy:轻量级可编程HTTP代理,实现API Mock与故障注入

1. 项目概述:一个轻量级的HTTP代理工具最近在折腾一些需要模拟不同网络环境或者进行API测试的项目时,我一直在寻找一个足够轻量、灵活且易于集成的HTTP代理工具。市面上成熟的代理方案很多,但要么功能过于臃肿,要么配置起来相当繁…...

Claude模型配置管理工具:从原理到实践,构建高效AI应用

1. 项目概述:一个为Claude模型量身定制的配置管理工具最近在折腾大语言模型本地部署和API调用时,我发现一个挺普遍的问题:虽然像Claude这样的模型能力很强,但每次想切换不同的使用场景——比如从写代码切换到写文案,或…...

基于RAG架构的企业级私有化大模型知识库实战指南

1. 项目概述:当大语言模型遇见企业级数据如果你最近在关注企业级AI应用,特别是如何安全、高效地利用大语言模型来处理和分析内部数据,那么“h2oai/h2ogpt”这个项目绝对值得你花时间深入了解。这不仅仅是一个简单的聊天机器人接口&#xff0c…...

Arm Neoverse CMN-650架构与编程实践详解

1. CMN-650架构概述Arm Neoverse CMN-650是一种基于Mesh拓扑的一致性互连网络,专为多核处理器和加速器系统设计。作为SoC内部的数据高速公路,它通过优化的路由算法和一致性协议,实现了高带宽、低延迟的核间通信。1.1 核心组件解析CMN-650由多…...

Python数据库编程与ORM

Python数据库编程与ORM一、数据库连接基础Python通过DB-API 2.0规范(PEP 249)统一了数据库接口。不同数据库使用不同的驱动,但API一致。import sqlite3# SQLite(内置,无需安装) conn sqlite3.connect(exam…...

去人类中心化研究引擎:AI如何突破学科壁垒驱动科研创新

1. 项目概述:一个“去人类中心化”的研究引擎最近在GitHub上看到一个挺有意思的项目,叫“De-Anthropocentric-Research-Engine”,直译过来就是“去人类中心化研究引擎”。第一眼看到这个标题,你可能和我一样,脑子里会冒…...

接入Taotoken后感受到的API调用延迟降低与错误率改善

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 接入Taotoken后感受到的API调用延迟降低与错误率改善 1. 背景与切换契机 作为一名长期在项目中集成大模型能力的开发者&#xff0…...

AI文本检测技术解析:从原理到实践,构建内容真实性鉴别工具

1. 项目概述:AI写作检测工具的核心价值最近在GitHub上看到一个挺有意思的项目,叫“AI-Writing-Detection”。光看名字,你大概就能猜到它是干什么的——检测一段文本是不是AI写的。这玩意儿现在可太有用了。自从大语言模型(LLM&…...

职得Offer校园求职助手Pro深度评测:一个AI Agent陪你跑完求职全流程

一、 职得Offer是什么?—— 不止是工具,更是全程陪伴的AI求职伙伴 在AI应用爆发的今天,面对市面上众多的简历模板、面经题库和招聘平台,求职者尤其是学生群体,依然会陷入“信息过载却无从下手”的困境。“职得Offer校…...

CM201-1-CH刷机避坑指南:S905L3B+UWE5621DS芯片组合刷机时,为什么必须取消‘擦除flash’?

CM201-1-CH刷机避坑指南:S905L3BUWE5621DS芯片组合的特殊性解析 每次刷机操作都像一场精密手术,而CM201-1-CH这款搭载S905L3B主控与UWE5621DS无线芯片组合的机顶盒,则像一位"特殊体质"的患者——常规操作可能导致不可逆的"医疗…...