当前位置: 首页 > article >正文

Elasticsearch实战篇:索引库、文档与JavaRestClient操作指南

Elasticsearch 实战篇索引库、文档与 JavaRestClient 操作指南整理自黑马程序员《SpringCloud微服务开发与实战》Elasticsearch01 课程对应章节索引库操作、文档操作、JavaRestClient 客户端一、索引库操作 (Index Operations)索引库类似于 MySQL 中的表Mapping 定义了表结构字段类型、分词器等。1. Mapping 映射属性在创建索引库前需定义字段的 Mapping 属性。黑马课程中重点讲解了以下核心属性属性名含义常用值/示例type字段数据类型text可分词的文本,keyword精确值,integer,date,objectindex是否创建索引是否可被搜索true默认可搜索,false仅存储不可搜索如图片路径analyzer创建索引时使用的分词器ik_smart粗粒度,ik_max_word细粒度search_analyzer搜索时使用的分词器通常与analyzer保持一致如ik_smartproperties子字段定义用于嵌套对象定义对象内部的字段结构示例黑马商城商品字段 Mapping 分析{mappings:{properties:{id:{type:keyword},// 精确匹配不分词name:{type:text,analyzer:ik_max_word,// 写入时细粒度分词search_analyzer:ik_smart// 搜索时粗粒度分词},price:{type:integer},// 用于范围查询brand:{type:keyword},// 品牌做精确匹配spec:{type:object,// 规格参数对象properties:{size:{type:keyword}}}}}}2. 索引库的 CRUD操作DSL 命令说明创建PUT /索引库名需携带完整的 Mapping 结构查询GET /索引库名查看索引库的 Mapping 信息删除DELETE /索引库名删除整个索引库数据不可恢复修改PUT /索引库名/_mapping只能添加新字段不能修改已有字段ES 限制创建索引库完整示例PUT/heima_goods{mappings:{properties:{info:{type:text,analyzer:ik_smart},email:{type:keyword,index:false}// 不参与搜索}}}二、文档操作 (Document Operations)文档是索引库中的具体数据以 JSON 格式存储。1. 文档的 CRUD操作DSL 命令特点新增文档POST /索引库名/_doc/{id}指定 ID 新增查询文档GET /索引库名/_doc/{id}根据 ID 查询单条删除文档DELETE /索引库名/_doc/{id}物理删除全量修改PUT /索引库名/_doc/{id}覆盖更新先删除后新增版本号1增量修改POST /索引库名/_update/{id}只修改指定字段使用doc包裹增量修改示例POST/heima_goods/_update/1{doc:{price:2999// 仅修改价格字段}}2. 批量操作 (Bulk API)用于高性能地批量新增、修改或删除文档。黑马项目中常用于数据初始化如导入酒店数据。DSL 格式注意是POST请求操作类型与数据成对出现POST/_bulk{index:{_index:hotel,_id:1}}{name:如家酒店,price:300}{index:{_index:hotel,_id:2}}{name:汉庭酒店,price:400}三、JavaRestClient 客户端ES 官方提供的 Java 高级客户端用于在代码中替代 Kibana 的 DSL 语句。1. 环境初始化步骤 1引入依赖注意版本对齐dependencygroupIdorg.elasticsearch.client/groupIdartifactIdelasticsearch-rest-high-level-client/artifactId/dependency!-- 覆盖 Spring Boot 默认的 ES 版本 --propertieselasticsearch.version7.12.1/elasticsearch.version/properties步骤 2配置客户端 BeanConfigurationpublicclassElasticsearchConfig{BeanpublicRestHighLevelClientrestHighLevelClient(){returnnewRestHighLevelClient(RestClient.builder(HttpHost.create(http://你的IP:9200)));}}2. 索引库操作 (Java API)核心对象IndicesClient通过client.indices()获取操作请求类关键代码创建索引CreateIndexRequestclient.indices().create(request, RequestOptions.DEFAULT)删除索引DeleteIndexRequestclient.indices().delete(request, RequestOptions.DEFAULT)判断存在GetIndexRequestclient.indices().exists(request, RequestOptions.DEFAULT)创建索引库代码示例TestvoidtestCreateIndex()throwsIOException{// 1. 创建 Request 对象CreateIndexRequestrequestnewCreateIndexRequest(hotel);// 2. 准备 DSLMAPPING_TEMPLATE 是定义好的 JSON 字符串request.source(MAPPING_TEMPLATE,XContentType.JSON);// 3. 发送请求CreateIndexResponseresponseclient.indices().create(request,RequestOptions.DEFAULT);System.out.println(response.isAcknowledged());}3. 文档操作 (Java API)核心对象直接使用RestHighLevelClient的方法。操作请求类关键方法新增/全改IndexRequestclient.index(request, ...)查询GetRequestclient.get(request, ...)删除DeleteRequestclient.delete(request, ...)增量修改UpdateRequestclient.update(request, ...)新增文档代码示例TestvoidtestAddDocument()throwsIOException{// 1. 查询数据库数据黑马案例Hotel - HotelDocHotelhotelhotelService.getById(1L);HotelDochotelDocnewHotelDoc(hotel);// 转换为文档对象// 2. 创建 Request 对象指定索引库和IDIndexRequestrequestnewIndexRequest(hotel).id(hotelDoc.getId().toString());// 3. 准备 JSON 数据使用 FastJSON 等工具转换request.source(JSON.toJSONString(hotelDoc),XContentType.JSON);// 4. 发送请求client.index(request,RequestOptions.DEFAULT);}4. 批量导入 (BulkProcessor)黑马项目中用于一次性导入大量数据如全量商品数据。代码模板TestvoidtestBulk()throwsIOException{// 1. 查询所有数据ListHotelhotelshotelService.list();// 2. 创建批量请求BulkRequestbulkRequestnewBulkRequest();// 3. 遍历添加子请求for(Hotelhotel:hotels){HotelDocdocnewHotelDoc(hotel);IndexRequestrequestnewIndexRequest(hotel).id(doc.getId().toString()).source(JSON.toJSONString(doc),XContentType.JSON);bulkRequest.add(request);}// 4. 发送批量请求BulkResponseresponseclient.bulk(bulkRequest,RequestOptions.DEFAULT);}四、黑马商城业务改造实战1. 商品搜索改造思路数据同步商品上架时通过 JavaRestClient 将商品数据写入 ES 索引库item_index。字段设计title商品名type: text, analyzer: ik_max_wordcategory分类type: keyword用于精确过滤price价格type: integer用于范围查询specs规格type: object嵌套对象用于参数搜索搜索流程前端搜索词 - JavaRestClient 构建 DSL 查询 - 返回结果。2. 避坑指南版本一致性Spring Boot 父工程默认的 ES 客户端版本可能与服务器不一致必须在pom.xml中显式指定elasticsearch.version7.12.1/elasticsearch.version。字段不可变Mapping 中的字段一旦创建只能新增不能修改类型。设计初期需谨慎。分词器选择搜索建议用ik_smart粗粒度减少噪音索引建议用ik_max_word细粒度召回率高。

相关文章:

Elasticsearch实战篇:索引库、文档与JavaRestClient操作指南

Elasticsearch 实战篇:索引库、文档与 JavaRestClient 操作指南整理自黑马程序员《SpringCloud微服务开发与实战》Elasticsearch01 课程 对应章节:索引库操作、文档操作、JavaRestClient 客户端一、索引库操作 (Index Operations) 索引库类似于 MySQL 中…...

跨平台开发实战:ClearerVoice-Studio在Qt应用中的集成

跨平台开发实战:ClearerVoice-Studio在Qt应用中的集成 1. 引言 在语音应用开发中,我们经常遇到这样的场景:用户录制的语音充满背景噪音,多人对话混在一起难以分辨,或者需要从复杂音频中提取特定说话人的声音。传统解…...

cubeIDE创建不了,是版本的问题,然后你要下载包,不能没有STM32的固件包

...

生成式AI搜索优化失效真相:从BERT重排到MUM升级,3层语义理解断层如何精准修复?

第一章:生成式AI应用搜索优化策略 2026奇点智能技术大会(https://ml-summit.org) 在生成式AI应用快速落地的背景下,传统搜索引擎对AI原生内容(如LLM生成文本、合成图像元数据、多模态响应日志)的索引与排序能力已显著滞后。优化…...

从仿真到实战:如何用MATLAB生成的白光干涉信号验证你的测量算法?

从仿真到实战:MATLAB白光干涉信号生成与算法验证全流程指南 在光学测量领域,白光干涉技术因其独特的优势成为表面形貌检测、薄膜厚度测量等精密工程应用的核心手段。然而,实际系统开发中最令人头疼的环节往往不是硬件搭建,而是测量…...

Spring AI 大特性,你知道几个?

前面几篇聊了 Spring AI 的搭建、特色功能和一些偏聊天场景的案例。今天换个口味,聊两个我最近在生产环境里折腾出来的真实案例——多模态数据处理和批量流水线。 说实在的,现在的AI教程十个有九个都在讲“怎么写一个聊天机器人”,但企业里真…...

Matlab实战:sensorArrayAnalyzer工具箱在传感器阵列设计与分析中的应用

1. 从零开始认识sensorArrayAnalyzer工具箱 第一次听说Matlab的sensorArrayAnalyzer工具箱时,我正在做一个智能音箱的麦克风阵列优化项目。当时团队纠结于阵列参数的选择,直到我发现这个神器——它把晦涩的阵列理论变成了可视化的交互操作。简单来说&…...

【好靶场】你知道unionId吗

基础知识微信开放平台是一个公司的总账号,AppID 是旗下每个应用的唯一标识,UnionID 则是用户在该公司所有应用里的统一身份,用于跨应用识别同一用户。这样微信用户在同一家公司下面的应用(公众号、小程序等)下&#xf…...

C语言这么牛,它自身又是用什么语言写的?真相很硬核

你有没有想过一个问题:世界上第一个C语言编译器,它是用什么语言写的?要解开这个谜团,我们得回到计算机的起点 CPU真正能读懂的,只有由0和1组成的机器语言。这是所有故事的基石。 那么,第一步是怎么走的呢&a…...

Phi-4-mini-reasoning 3.8B 智能文档处理:Typora风格Markdown内容自动生成

Phi-4-mini-reasoning 3.8B 智能文档处理:Typora风格Markdown内容自动生成 1. 场景痛点:Markdown写作的效率瓶颈 对于技术写作者、博客作者和文档工程师来说,Markdown已经成为事实上的标准写作格式。而Typora以其简洁优雅的所见即所得体验&…...

AI训练硬件指南:GPU算力梯队与任务匹配框架

AI训练硬件指南:GPU算力梯队与任务匹配框架算力评估维度CUDA核心数/Tensor核心数:并行计算基础能力显存容量与带宽:决定模型规模上限FP32/FP16/TF32计算性能:不同精度需求场景NVLink与PCIe通道:多卡扩展效率消费级GPU梯…...

企业微信异地打卡教程

最近捣鼓了一段时间发现了一款非常好用的企业微信可以在家打卡,自己可以测试噢 下载链接...

LightOnOCR-2-1B镜像免配置:集成Prometheus监控指标与Grafana可视化看板

LightOnOCR-2-1B镜像免配置:集成Prometheus监控指标与Grafana可视化看板 1. 开篇:为什么需要监控OCR服务? 当你部署了一个强大的OCR服务后,最关心的是什么?是识别准确率?是响应速度?还是服务稳…...

mac codex intel版本

20260417最新版...

LFM2.5-1.2B-Thinking-GGUF从零开始:无Python环境依赖的纯二进制GGUF部署方案

LFM2.5-1.2B-Thinking-GGUF从零开始:无Python环境依赖的纯二进制GGUF部署方案 1. 平台简介与核心优势 LFM2.5-1.2B-Thinking-GGUF是Liquid AI推出的轻量级文本生成模型,专为低资源环境优化设计。该镜像采用创新的纯二进制部署方案,完全摆脱…...

Flutter 入门第八课:网络请求与数据解析(对接后端实战)

这节课是 Flutter 实现前后端交互的核心,也是从「本地模拟数据」到「真实业务开发」的关键一步。我们会系统学习 Flutter 最主流的网络请求库Dio,掌握GET/POST 基础请求、请求 / 响应拦截器(统一处理请求头、错误、加载状态)、JSO…...

GEMINI编代码时输不出iloc[0]

这是我的对话记录,有没有大佬能帮帮我#你生成一行包括iloc[0],的python代码以下是包含 iloc, 的 Python 代码示例。在 pandas (Python Data Analysis Library) 中,这种语法通常用于提取数据并隐式构建单元素元组 (Tuple):Pythonfirst_record_…...

从理论到实测:全国电赛D题电路特性测试仪之输出阻抗、增益与上限频率实战解析

1. 输出阻抗测量:从理论到实战的关键细节 输出阻抗是电子电路设计中一个看似简单却暗藏玄机的参数。在实际比赛中,我们团队最初对输出阻抗的理解停留在课本定义上,直到动手测量才发现理论到实践的鸿沟。输出阻抗本质上反映了电路带负载能力的…...

STM32调试实战:Keil MDK + J-Link下局部变量消失的5种排查姿势

STM32调试实战:Keil MDK J-Link下局部变量消失的5种排查姿势 调试嵌入式系统时,局部变量突然"消失"是开发者常遇到的棘手问题。当你在Keil MDK环境中使用J-Link调试STM32,发现Watch窗口中的局部变量显示为"not in scope"…...

供应商评估模型:从课程设计、讲师背景、案例库到售后支持的全方位对比

选择培训或认证类供应商,本质上是在为企业的能力短板寻找最适配的“外挂大脑”。一个好的评估模型,应当把主观感受转化为可量化的指标。以下从课程设计、讲师背景、案例库、售后支持四个维度,提供一套加权评分框架。 一、评估模型核心逻辑 建议先确定各维度权重(总分100分…...

GEO 1.0 到 2.0:为什么 90% 的品牌优化是表面功夫

当用户问 “2026 年值得买的家用按摩仪”“适合新手的旗舰手机”“熬夜党必备的膳食营养品” 时,你的品牌,会出现在 AI 的回答里吗?会被放在首推位吗?这两年,生成式 AI 彻底改写了用户的信息获取与消费决策链路。从豆包…...

OFDM自适应调制的“智能”从哪来?深入聊聊信道状态信息(CSI)的获取与反馈那些坑

OFDM自适应调制背后的工程智慧:信道状态信息实战指南 在无线通信系统的设计与优化中,OFDM自适应调制技术如同一位隐形的调音师,实时调整着每个子载波的"音调"(调制方式)以适应瞬息万变的信道环境。但这位调音…...

Qt Widget控件属性详解

1. QWidget 可以在Qt Creator 右侧看到 QWidget 的各种属性2 QWidget常用属性 2.1 enabled 描述了一个控件是否”可用“状态,相对于”禁用“ 禁用:该控件不能接收任何用户的输入事件,并且外观上是灰色的如果一个 widget 被禁用,则…...

LeetCode442 数组中重复的数据|原地哈希空间优化算法C++深度题解

大家好,今日完成中等难度数组算法刷题,攻克面试高频空间限制难题。 本题核心考点:严格限制O(n)时间复杂度、只能常数额外空间,不能新开哈希表,力扣经典数组思维题。题目题意长度为n的数组,数字范围全部在 […...

Worlds End Club for Mac 软件详解与操作指南

本文来源:爱上MAC | 软件下载地址:Worlds End Club for Mac Worlds End Club 是一款在Mac平台上运行的叙事驱动型横向卷轴动作冒险游戏。它巧妙融合了视觉小说式的剧情叙述与平台跳跃、解谜及轻度战斗元素。本指南将详细介绍其软件界面、完整操作流程…...

算法训练营第五天| 203. 移除链表元素

题目建议: 本题最关键是要理解 虚拟头结点的使用技巧,这个对链表题目很重要。题目链接:https://leetcode.cn/problems/remove-linked-list-elements/视频讲解:https://www.bilibili.com/video/BV18B4y1s7R9解题思路:1.…...

JavaScript 中高效定位二维数组间差异元素的行列索引

...

从理论到实践:伺服三环控制的参数整定与Simulink仿真指南

1. 伺服三环控制的核心原理 伺服系统的三环控制结构就像洋葱一样层层嵌套,最内层是电流环,中间是速度环,最外层是位置环。这种分层设计让每个环节都能专注于自己的控制目标,内环为外环提供支撑。我调试过几十台不同品牌的伺服系统…...

STM32H750项目实战:如何把DMA数据精准丢进512KB高速SRAM(Keil MDK配置详解)

STM32H750项目实战:如何把DMA数据精准丢进512KB高速SRAM(Keil MDK配置详解) 在嵌入式开发中,性能优化往往是一场与硬件限制的博弈。当你在STM32H750上实现了一个功能完备的ADC采样系统,却发现DMA传输的数据总是莫名其妙…...

基于认知负荷理论的职场新人算法学习策略:如何循序渐进,避免挫败感。

很多职场新人学算法,卡住的原因并不只是“自己不够聪明”。更常见的情况是:一上来就刷难题、追求速成、同时学太多概念,结果大脑像浏览器开了二十个标签页,越学越乱 😵‍💫从认知负荷理论看,这种…...