当前位置: 首页 > news >正文

阿里巴巴-淘宝搜索排序算法学习

模型效能:模型结构优化

模型效能:减枝

FLOPS:每秒浮点运算的次数

模型效能:量化

基于统计阈值限定,基于学习阈值限定。

平台效能:一站式DL训练平台

平台效能:搜索模型的系统流程

协同关系:一天全量训练后,把之前流模型训练参数全部覆盖掉,第二天流模型,在批模型的基础上再开始增量训练,基本上就是这么一个模式。
部署完:一次请求后,对5000个doc进行打分,user的特征是一样的,同一个用户,对于用户特征一次运算就可以了。考虑到存储的效率和量化的处理。

系统创新:端云联动的排序系统

端智能:把神经网络部署到用户的手机上,用户的实时行为,非常实时的行为,秒级实时行为,在下次发起请求之前,没办法利用实时,所以要部署到手机端上。
用户产生的细粒度的数据量是非常大的,不太适合全部上传到云上面,比较敏感的用户信息。
在用户不断的曝光点击,这样的下滑浏览的过程中,感知用户个性化行为,从而对手机上缓冲池中,未曝光的商品排序进行一个更新。

搜索推荐(Search Recommendation)是指在用户搜索过程中,系统根据用户的搜索历史、浏览历史、搜索关键词等因素,提供相关的搜索建议和推荐结果。这些推荐结果可以帮助用户快速找到所需的信息,提高用户体验。
SRP行为(Search Result Page behavior)是指用户在搜索结果页面(Search Result Page, SRP)上的行为,例如点击搜索结果、滚动页面等。这些行为可以作为反馈,帮助搜索引擎优化搜索结果的排序和推荐。

端上排序模型设计

名称解释

PointWise:PointWise对单个特征排序打分
ListWise: 对一组特征排序打分
GAUC(Gini normalized Area Under the ROC Curve):是在广告点击率预测中广泛使用的一种性能度量标准。 它通过对预测结果排序并计算ROC曲线下的面积来衡量分类器的性能。
CTR_GAUC:CTR_GAUC指的则是根据GAUC进行加权处理得到的用于评估广告点击率预测模型性能的指标,通常用于评估线上广告推荐系统的性能。它同时考虑到CTR和GAUC,以CTR为权重对GAUC进行加权平均计算,能够更全面地反映广告推荐模型的性能(来自CHAT_GPT的解答)

要点

在端上格式转化后,存储量更低

参考资料

https://www.bilibili.com/video/BV1QS4y1j7yK/?spm_id_from=333.337.search-card.all.click (淘宝搜索排序算法)

相关文章:

阿里巴巴-淘宝搜索排序算法学习

模型效能:模型结构优化 模型效能:减枝 FLOPS:每秒浮点运算的次数 模型效能:量化 基于统计阈值限定,基于学习阈值限定。 平台效能:一站式DL训练平台 平台效能:搜索模型的系统流程 协同关系…...

〖Python网络爬虫实战⑮〗- pyquery的使用

订阅:新手可以订阅我的其他专栏。免费阶段订阅量1000python项目实战 Python编程基础教程系列(零基础小白搬砖逆袭) 说明:本专栏持续更新中,目前专栏免费订阅,在转为付费专栏前订阅本专栏的,可以免费订阅付费…...

SQL综合查询下

SQL综合查询下 目录SQL综合查询下18、查询所有人都选修了的课程号与课程名题目代码题解19、SQL查询:查询没有参加选课的学生。题目代码20、SQL查询:统计各门课程选修人数,要求输出课程代号,课程名,有成绩人数&#xff…...

全连接层FC

lenet结构: 输入层(Input Layer):接收手写数字的图像数据,通常是28x28的灰度图像。 卷积层1(Convolutional Layer 1):对输入图像进行卷积操作,提取低级别的特征,使用 6 个大小为 5x5 的卷积核进行卷积,得到 6 个输出特征图,激活函数为 Sigmoid。 平均池化层1(Aver…...

图的遍历及连通性

文章目录 图的遍历及连通性程序设计程序分析图的遍历及连通性 【问题描述】 根据输入的图的邻接矩阵A,判断此图的连通分量的个数。 【输入形式】 第一行为图的结点个数n,之后的n行为邻接矩阵的内容,每行n个数表示。其中A[i][j]=1表示两个结点邻接,而A[i][j]=0表示两个结点无…...

DJ3-4 实时调度

目录 3.4.1 实现实时调度的基本条件 1. 提供必要的信息 2. 系统的处理能力强 3. 采用抢占式调度机制 4. 具有快速切换机制 3.4.2 实时调度算法的分类 1. 非抢占式调度算法 2. 抢占式调度算法 3.4.3 常用的几种实时调度算法 1. 最早截止时间优先 EDF(Ea…...

Oracle之PL/SQL游标练习题(三)

游标练习题目1、定义游标:列出每个员工的姓名部门名称并编程显示第10个到第20个记录2、定义游标:从雇员表中显示工资大于3000的记录,只要姓名、部门编号和工资,编程显示其中的奇数记录3、用游标显示所有部门编号与名称&#xff0c…...

docker运行服务端性能监控系统Prometheus和数据分析系统Grafana

文章目录一、Prometheus的安装和运行1、使用docker拉取镜像2、创建prometheus.yml文件3、启动容器4、查看启动是否成功5、记录安装过程中出现的错误二、Grafana的安装和运行1、使用docker拉取镜像2、创建grafana3、运行grafana4、查看grafana运行日志5、登录grafana一、Prometh…...

【Linux】【应用层】多线程编程

一、线程创建 Linux 中的 pthread_create() 函数用来创建线程&#xff0c;它声明在<pthread.h>头文件中&#xff0c;语法格式如下&#xff1a; int pthread_create(pthread_t *thread,const pthread_attr_t *attr,void *(*start_routine) (void *),void *arg);各个参数…...

GameFramework 框架详解之 如何接入热更框架HybridCLR

一.前言 HybridCLR是一个特性完整、零成本、高性能、低内存的近乎完美的c#热更新方案 GameFramework是一个非常出色完整的基于Unity引擎的游戏框架,里面包含了非常多的模块,封装非常完整。 以前市面上的热更大多数都是Lua为主,后来出了一个ILRuntime的C#热更框架,虽然性能…...

全国青少年软件编程(Scratch)等级考试二级考试真题2023年3月——持续更新.....

一、单选题(共25题,共50分) 1. 小猫的程序如图所示,积木块的颜色与球的颜色一致。点击绿旗执行程序后,下列说法正确的是?( ) A.小猫一直在左右移动,嘴里一直说着“抓到了”。 B.小猫会碰到球,然后停止。 C.小猫一直在左右移动,嘴里一直说着“别跑” D.小猫会碰到球,…...

HTML2.1列表标签

列表标签种类 无序列表 有序列表 自定义列表 使用场景&#xff1a;在列表中按照行展示关联性内容。 特点&#xff1a;按照行的形式&#xff0c;整齐显示内容。 一、无序列表 标签名说明ul无序列表整体&#xff0c;用于包裹li标签li表示无序列表的每一项&#xff0c;用于包…...

在 Flutter 多人视频通话中实现虚拟背景、美颜与空间音效

前言 在之前的「基于声网 Flutter SDK 实现多人视频通话」里&#xff0c;我们通过 Flutter 声网 SDK 完美实现了跨平台和多人视频通话的效果&#xff0c;那么本篇我们将在之前例子的基础上进阶介绍一些常用的特效功能&#xff0c;包括虚拟背景、色彩增强、空间音频、基础变声…...

Ambari-web 架构

Ambari-web 使用的前端 Embar.js MVC 框架实现&#xff0c;Embar.js 是一个 TodoMVC 框架&#xff0c;涵盖了单页面应用&#xff08;single page application&#xff09;几乎所有的行为 Nodejs 是一个基于 Chrome JavaScript 运行时建立的一个平台&#xff0c;用来方便的搭建…...

对接百思买Best Buy EDI 的注意事项

在此前的文章&#xff1a;《Best Buy Drop Ship(Commerce hub) EDI业务测试常见报错及解决》中&#xff0c;我们介绍了在业务测试过程中遇到的常见报错及解决方案&#xff0c;以下在此基础上进行补充。 数据未能成功发送给Best Buy可能遇到的情况 Best Buy EDI项目传输业务报…...

2023年郑州重点建设项目名单公布,中创“算力数据中心”项目入选!

4月7日&#xff0c;郑州市人民政府网站公布2023年郑州市重点建设项目名单&#xff0c;名单共列项目680个&#xff0c;总投资1.08万亿元&#xff0c;年度计划投资2691亿元。 在创新驱动能力提升项目名单里&#xff0c;中创算力与人民网人民数据&#xff08;国家大数据灾备中心&a…...

Pytorch 容器 - 1. Module类介绍

目录 1. 基于Module构建自己的网络 2. Module的初始化变量 3. Modules中需要子类 forward() 4. Modules中其他内置函数 1. 基于Module构建自己的网络 torch.nn.Module是所有神经网络模块的基类&#xff0c;如何定义自已的网络&#xff1a; 由于 Module 是神经网络模块的基…...

百度墨卡托坐标转化笔记

一、墨卡托坐标转化 调研了python和java多种实现方式的转换&#xff0c;发现有的不符合需求&#xff0c;原因还没找到。 我是用百度地图返回的poi边界&#xff08;返回的是墨卡托坐标&#xff09; 转换的原理没有深入研究&#xff0c;直接拿来用的&#xff0c;测试可行&…...

每日学术速递4.12

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.HC 随着新的“生成代理”论文的发布&#xff0c;LLM刚刚达到了一个重要的里程碑——通过使用 LLM&#xff0c;生成代理能够在受《模拟人生》启发的交互式沙箱中模拟类人行为。代理架构扩展…...

HarmonyOS/OpenHarmony公司级技术开发团队硬件基本配置清单

有朋友公司咨询进入HarmonyOS/OpenHarmony领域&#xff0c;组建技术团队&#xff0c;硬件设备的基本配置应该是怎么样的比较合适&#xff1f;这个是进入鸿蒙开发领域相关配置的第一步&#xff0c;我们以一个基本的团队配置为例说明&#xff0c;供想进入的团队参考。 HarmonyOS/…...

Allegro中Route Keepout、Design Outline和Cutout到底怎么用?一张图讲清PCB布局中的‘禁区’设置

Allegro中三大边界工具实战指南&#xff1a;Route Keepout、Design Outline与Cutout的精准运用 在PCB设计领域&#xff0c;边界定义如同城市规划中的红线&#xff0c;既决定了板卡的物理形态&#xff0c;又影响着电气性能的发挥。Cadence Allegro作为行业标准工具&#xff0c;提…...

SAP ECC老司机避坑指南:FAGLGVTR和F.07年结操作,这5个细节不注意就白干了

SAP ECC年结实战&#xff1a;FAGLGVTR与F.07操作中的5个致命陷阱 每到年末&#xff0c;财务部门的紧张气氛总是格外浓厚。对于使用SAP ECC系统的企业来说&#xff0c;年结操作就像一场没有彩排的现场演出——任何一个小失误都可能导致数据混乱、报表错误&#xff0c;甚至影响整…...

如何快速掌握音频频谱分析:Spek开源工具完整指南

如何快速掌握音频频谱分析&#xff1a;Spek开源工具完整指南 【免费下载链接】spek Acoustic spectrum analyser 项目地址: https://gitcode.com/gh_mirrors/sp/spek 想要深入了解音频文件的内部结构吗&#xff1f;Spek音频频谱分析器是你的理想选择&#xff01;这款免费…...

对比官方价格Taotoken的活动价确实带来了可观节省

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 对比官方价格&#xff0c;Taotoken的活动价确实带来了可观节省 作为一名长期使用多个大模型API进行项目开发的个人开发者&#xff…...

基于ReAct范式的链式追踪工具:提升学术研究效率的AI智能体实践

1. 项目概述与核心价值如果你经常需要做文献调研、追踪某个科学概念的源头&#xff0c;或者想搞清楚一个复杂话题背后的证据链&#xff0c;那你一定体会过在搜索引擎和无数个学术网站之间反复横跳的痛苦。传统的搜索方式&#xff0c;比如在Google Scholar里输入一个关键词&…...

如何通过浏览器脚本实现网盘文件直链下载:LinkSwift 完全指南

如何通过浏览器脚本实现网盘文件直链下载&#xff1a;LinkSwift 完全指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云盘…...

英特尔®oneAPI 数学内核库(oneMKL)在Windows上的高效部署与VS2022集成指南

1. 为什么选择oneMKL&#xff1f;从矩阵计算到AI加速的全能选手 第一次接触oneMKL是在处理一个图像处理项目时&#xff0c;当时需要实现大规模的矩阵变换运算。用原生C写的算法跑起来像老牛拉车&#xff0c;直到同事推荐了英特尔的这个数学库。实测下来&#xff0c;同样的算法…...

颠覆性英雄联盟智能助手:如何用League Akari告别繁琐操作,专注游戏核心

颠覆性英雄联盟智能助手&#xff1a;如何用League Akari告别繁琐操作&#xff0c;专注游戏核心 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power &#x1f680;. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit …...

AI开发者必备:开源资源导航站ai-hub的设计哲学与高效使用指南

1. 项目概述&#xff1a;一个面向AI开发者的开源资源集散地最近在GitHub上闲逛&#xff0c;发现了一个挺有意思的仓库&#xff0c;叫xielong/ai-hub。光看名字&#xff0c;你可能会觉得这又是一个“AI工具箱”或者“模型集合”&#xff0c;但点进去仔细研究后&#xff0c;我发现…...

Windows热键侦探:3分钟快速找出占用快捷键的程序

Windows热键侦探&#xff1a;3分钟快速找出占用快捷键的程序 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective 你是否曾经遇到…...