当前位置: 首页 > article >正文

别再硬编码了!用Elasticsearch的Terms lookup query实现动态搜索条件(附用户偏好推荐实战)

动态搜索的艺术用Elasticsearch Terms lookup构建个性化推荐系统每次打开购物APP首页推荐总能精准命中你的喜好——这背后藏着怎样的技术魔法想象一下当用户A喜欢电子产品而用户B偏爱美妆时如何让同一套代码自动适配不同用户的偏好硬编码显然不是答案。今天我们将深入Elasticsearch的Terms lookup query揭秘动态搜索条件的工程实践。1. 硬编码之痛传统方案的三大死穴曾见过这样的代码吗if userVIP then recommend_luxury_items()。这种硬编码方式在快速迭代的业务场景中暴露了致命缺陷典型问题场景用户画像变更需要重新部署代码多维度组合条件导致if-else嵌套地狱A/B测试时需频繁修改业务逻辑// 典型硬编码示例 { query: { terms: { category: [electronics, gadgets] // 写死的品类 } } }对比动态方案的工程价值维度硬编码方案Terms lookup方案响应速度毫秒级毫秒级带缓存优化维护成本高需重启服务零实时生效扩展性差需修改代码极强动态加载多租户支持需特殊处理原生支持提示在日均UV超百万的电商平台硬编码方案会导致每周至少2次紧急发布2. Terms lookup核心机制深度解析这个看似简单的功能背后Elasticsearch其实完成了三项关键操作分布式文档获取根据(index, id, routing)三元组定位文档分片字段值提取从_source中按path提取目标字段支持嵌套字段查询重写将获取的值转换为terms查询条件性能关键参数PUT _cluster/settings { persistent: { index.max_terms_count: 100000 // 调整terms上限 } }实现细节注意点要求_source字段开启默认开启文档更新到查询生效有近实时延迟通常1秒内可通过preference参数控制分片查询路由3. 用户偏好推荐系统实战让我们构建一个完整的推荐流水线3.1 索引设计最佳实践用户画像索引PUT user_profiles { mappings: { dynamic: strict, properties: { preferred_categories: { type: keyword, ignore_above: 256 }, recent_clicks: { type: keyword, doc_values: false } } } }商品索引的特殊处理PUT products { mappings: { properties: { category: { type: keyword, eager_global_ordinals: true // 提升terms查询性能 } } } }3.2 实时数据同步方案采用双写补偿机制保证数据一致性# 伪代码示例 def update_user_preference(user_id, categories): # 1. 更新数据库 db.execute(UPDATE profiles SET categories? WHERE user_id?, categories, user_id) # 2. 同步到ES es.update( indexuser_profiles, iduser_id, body{doc: {preferred_categories: categories}} ) # 3. 失败时写入补偿队列 except Exception as e: mq.send(es_retry, {user_id: user_id, categories: categories})3.3 复合查询构建技巧结合bool查询实现多维度加权GET /products/_search { query: { function_score: { query: { bool: { must: [ {match: {name: 手机}} ], should: [ { terms: { category: { index: user_profiles, id: 12345, path: preferred_categories }, boost: 2.0 } }, { terms: { brand: { index: user_profiles, id: 12345, path: preferred_brands }, boost: 1.5 } } ] } }, functions: [ { field_value_factor: { field: sales_7d, modifier: log1p } } ] } } }4. 性能优化进阶策略当用户偏好包含上千个terms时这些技巧很关键缓存层设计// 伪代码多级缓存方案 public ListString getPreferredCategories(String userId) { // 1. 查本地缓存 ListString categories localCache.get(userId); if (categories ! null) return categories; // 2. 查Redis集群 categories redisCluster.get(userId); if (categories ! null) { localCache.set(userId, categories); return categories; } // 3. 回源ES查询 categories esClient.termsLookup(...); redisCluster.setex(userId, 300, categories); localCache.set(userId, categories); return categories; }分片路由优化GET /products/_search?preferenceuser12345 { query: { terms: { category: { index: user_profiles, id: 12345, path: preferred_categories, routing: user12345 // 确保定位到相同分片 } } } }压测数据显示在百万级用户场景下经过优化的Terms lookup查询平均响应时间控制在15ms以内比直接使用SQL join方案快20倍以上。

相关文章:

别再硬编码了!用Elasticsearch的Terms lookup query实现动态搜索条件(附用户偏好推荐实战)

动态搜索的艺术:用Elasticsearch Terms lookup构建个性化推荐系统 每次打开购物APP,首页推荐总能精准命中你的喜好——这背后藏着怎样的技术魔法?想象一下,当用户A喜欢电子产品而用户B偏爱美妆时,如何让同一套代码自动…...

告别玄学调参:用‘对齐’和‘均匀性’两个指标,手把手优化你的对比学习模型

对比学习调参实战:用对齐性和均匀性指标优化模型性能 在计算机视觉和自然语言处理领域,对比学习已经成为无监督表示学习的主流方法之一。SimCLR、MoCo等框架的成功应用证明了对比学习在提取高质量特征方面的强大能力。然而,许多工程师在实际应…...

让你的技术文档和Readme“活”起来:GitHub/GitLab Markdown表情使用指南与最佳实践

让你的技术文档和Readme“活”起来:GitHub/GitLab Markdown表情使用指南与最佳实践 在开源项目的世界里,第一印象往往决定了开发者是否会驻足深入了解你的项目。而技术文档和Readme作为项目的"门面",如何让它们在众多同类项目中脱颖…...

3步搞定视频硬字幕提取:本地化AI工具终极指南

3步搞定视频硬字幕提取:本地化AI工具终极指南 【免费下载链接】video-subtitle-extractor 视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。A…...

免费虚拟游戏手柄终极指南:vJoy完整配置与开发实战

免费虚拟游戏手柄终极指南:vJoy完整配置与开发实战 【免费下载链接】vJoy Virtual Joystick 项目地址: https://gitcode.com/gh_mirrors/vj/vJoy 想要在Windows系统上创建自定义的游戏控制器,却不想购买昂贵的硬件设备?您是否遇到过游…...

.NET C# New Features 新增功能介绍-ASP.NET Core

前面我们对 Kafka 的整体架构和一些关键的概念有了一个基本的认知,本文主要介绍 Kafka 的一些配置参数。掌握这些参数的作用对我们的运维和调优工作还是非常有帮助的。 写在前面 Kafka 作为一个成熟的事件流平台,有非常多的配置参数。详细的参数列表可以…...

C# 13新特性 × Blazor深度耦合面试题集:Record structs在组件状态管理中的不可变陷阱,模式匹配路由解析实战(VS2026预览版实测)

第一章:C# 13 Blazor 2026现代Web开发趋势概览C# 13 和 Blazor 2026 的协同演进正重新定义全栈 .NET Web 开发的边界。语言层面,C# 13 引入了原生泛型属性(primary constructors 增强)、模式匹配对 ref struct 的完整支持&#x…...

拆解一个百元级激光雷达模块:用RPLIDAR A1或思岚科技Slamtec做个DIY避障小车(附代码)

百元级激光雷达DIY实战:从RPLIDAR A1到自主避障小车的完整指南 激光雷达技术正以惊人的速度渗透到消费级市场,曾经动辄上万元的设备如今只需几百元就能入手。这为机器人爱好者和创客们打开了一扇全新的大门——我们可以用RPLIDAR A1这类低成本设备&#…...

告别FPS采样慢!用RandLA-Net的随机采样高效处理大规模点云(附S3DIS数据集实战)

突破大规模点云处理瓶颈:RandLA-Net随机采样技术深度解析与实战 点云数据处理在自动驾驶、三维重建和机器人导航等领域扮演着关键角色,但传统方法如FPS(最远点采样)在面对百万级点云时往往力不从心。我曾在一个城市级三维建模项目…...

D3KeyHelper终极指南:5分钟上手暗黑3最强按键宏工具

D3KeyHelper终极指南:5分钟上手暗黑3最强按键宏工具 【免费下载链接】D3keyHelper D3KeyHelper是一个有图形界面,可自定义配置的暗黑3鼠标宏工具。 项目地址: https://gitcode.com/gh_mirrors/d3/D3keyHelper 还在为暗黑3中频繁的技能操作而手指酸…...

别再踩坑了!微信小程序this.setData修改对象属性的两种正确姿势(附数组场景)

微信小程序this.setData操作对象属性的深度避坑指南 刚接触微信小程序开发时,我曾在this.setData修改对象属性上栽过不少跟头。记得有一次深夜调试,明明逻辑看起来没问题,页面却始终不更新,最后发现是对象属性修改方式不当导致的。…...

C# 文件上传的服务器端加密 C#如何在存储到S3或Azure Blob时启用加密

必须在IFormFile流读取完成后、写入S3前加密,使用AesGcm或AesCryptoServiceProvider,密钥和nonce须安全存储于配置或Key Vault,S3 ContentLength需设为加密后真实长度。ASP.NET Core 中上传文件后立即加密再传 S3直接在内存中加密&#xff0c…...

【产教融合,协同育人】Altium 出席第七届全国高校自动化类专业教学论坛

2026年4月10日至12日,第七届全国高校自动化类专业教学论坛在西安盛大启幕。作为合作伙伴,Altium 教育生态负责人宋斌出席了此次大会,与在场代表们共话自动化类专业高质量发展新路径、新形态与新实践。Altium 教育生态负责人宋斌进行主题演讲依…...

linux 安装 Elasticsearch Kibana

1.下载 通过网盘分享的文件:es 链接: https://pan.baidu.com/s/1JO07VJ8nVsfyC0TzHaLGKw?pwd1dgu 提取码: 1dgu 2.创建 es 用户, es 无法使用root用户启动 # 创建用户组用户 groupadd es useradd -m -g es es # 设置密码(可选) passwd es # …...

LeetCode 1722. 执行交换操作后的最小汉明距离 详细技术解析

LeetCode 1722. 执行交换操作后的最小汉明距离 详细技术解析 一、题目核心考点剖析 本题的核心是理解「允许交换」的本质的,以及如何利用这种交换特性最小化汉明距离。关键考点如下: 交换的传递性:allowedSwaps 中给出的交换对具有传递性。例如,若允许交换 [0,1] 和 [1,2…...

Driver Store Explorer:Windows驱动存储管理的开源系统优化工具终极指南

Driver Store Explorer:Windows驱动存储管理的开源系统优化工具终极指南 【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 你是否曾为Windows系统中不断膨胀的驱动存储而烦恼&…...

PYTHON学习笔记12(os模块)

OS文件/目录方法os模块是python标准库中的一个重要模块,提供了与操作系统交互的功能,通过此模块可以执行文件操作、目录操作、环境变量管理、进程管理等任务。os模块是跨平台的,可以在不同的操作系统使用相同的代码。使用os模块之前&#xff…...

3分钟搞定B站旧版界面恢复:Bilibili-Old完整使用教程

3分钟搞定B站旧版界面恢复:Bilibili-Old完整使用教程 【免费下载链接】Bilibili-Old 恢复旧版Bilibili页面,为了那些念旧的人。 项目地址: https://gitcode.com/gh_mirrors/bi/Bilibili-Old 还在怀念B站那个简洁经典的小电视播放器吗?…...

别再只调参了!用PyTorch的torchvision.transforms给你的CIFAR-10模型做个‘数据SPA’

数据SPA革命:用torchvision.transforms解锁CIFAR-10模型的隐藏潜力 当你的ResNet-18在CIFAR-10上准确率卡在75%时,与其无休止地调整学习率和batch size,不如试试这个被多数人忽视的"数据美容术"。想象一下,同样的训练样…...

Adobe-GenP 3.0终极指南:三步解锁Adobe全家桶的完整教程

Adobe-GenP 3.0终极指南:三步解锁Adobe全家桶的完整教程 【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP 你是否曾经面对Adobe Creative Cloud高昂的订阅…...

Windows Cleaner终极指南:3步解决C盘空间不足难题

Windows Cleaner终极指南:3步解决C盘空间不足难题 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服! 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 你是否曾经打开电脑,发现C盘已经红得发亮…...

VMware ovftool隐藏玩法:从格式互转、代理设置到对接vCenter的完整避坑手册

VMware ovftool高阶实战:从格式转换到企业级部署的深度解析 引言 在虚拟化环境管理中,OVF(Open Virtualization Format)作为行业标准格式,已经成为跨平台虚拟机迁移的重要载体。而VMware ovftool作为官方提供的命令行工…...

小白必看!零基础 SRC 漏洞挖掘完整指南:该学什么,如何入门?

零基础入门SRC漏洞挖掘(干货版):该学什么?怎么学? 摘要:很多零基础小白想入门SRC漏洞挖掘,却陷入“不知道学什么、从哪开始学”的误区,要么盲目跟风学复杂工具,要么跳过…...

如何下载huggingface数据

使用 Hugging Face 新版 CLI 工具 hf 下载数据集(国内镜像加速版) 在进行机器学习和深度学习项目时,我们经常需要从 Hugging Face Hub 下载公开的数据集。然而,由于网络原因,国内用户直接访问 Hugging Face 官方源时往…...

从QNX到Android Auto:车载Camera软件栈全解析,高通8155平台上的IFE、BPS、IPE都干了啥?

车载摄像头技术栈深度解析:从传感器到多屏协同的完整链路 在智能座舱系统中,摄像头已从简单的倒车影像工具演变为支撑DMS(驾驶员监控)、OMS(乘员监控)、AVM(全景环视)等高级功能的核…...

MetaComputing AI PC with Framework Laptop 13 X OpenClaw系列二:Shopify订单统计

前情回顾:https://metacomputing.io/blogs/news/metacomputing-ai-pc-with-framework-laptop-13-openclaw-part-1-building-an-intelligent-discord-bot 上次使用OpenClaw打造了Discord智能聊天机器人,体验非常丝滑!这次我们把OpenClaw和Sho…...

如何快速配置思源宋体:开源中文字体的完整实战指南

如何快速配置思源宋体:开源中文字体的完整实战指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为寻找既专业又免费的中文字体而烦恼吗?思源宋体&#x…...

智能Fastboot可视化工具:如何一键管理Android设备刷机与分区

智能Fastboot可视化工具:如何一键管理Android设备刷机与分区 【免费下载链接】FastbootEnhance A user-friendly Fastboot ToolBox & Payload Dumper for Windows 项目地址: https://gitcode.com/gh_mirrors/fa/FastbootEnhance Fastboot Enhance是一款专…...

别再让OCV拖慢你的芯片!手把手教你用set_timing_derate优化时序(附CPPR实战)

芯片时序优化实战:用set_timing_derate与CPPR攻克OCV难题 在28nm以下工艺节点,芯片设计师们常会遇到一个令人头疼的现象——明明仿真时一切正常,流片后却因时序违例导致频率上不去。上周和某头部AI芯片公司的同事聊到这个问题,他们…...

从自动售货机到芯片验证:手把手拆解BDD如何把指数级问题‘压扁’

从自动售货机到芯片验证:BDD如何将指数级问题"压扁"的魔法 当你站在一台老式自动售货机前,投入硬币组合时,是否想过这简单的机械动作背后隐藏着芯片验证领域的革命性算法?35美分的自动售货机验证问题,恰如芯…...