当前位置: 首页 > news >正文

整理mongodb文档:索引

个人博客

整理mongodb文档:索引

个人博客,求关注,有问题的地方欢迎指出,觉得讲解的繁琐的也请指出

文章概叙

本文主要还是在shell下的操作。让大家了解下mongodb中index的用途,基本的索引的新增、查看、删除等,最后再提一嘴复合索引。

数据准备

大家都知道mongodb跟javaScript的关系,所以我就不解释为什么用下面的sql来创建百万条数据了,我可不想自己手动输入百万条数据。

db.test.insertMany(new Array(1000000).fill(1).map((v, index) => {return {index,single_digit: index % 10,}})
);

比如我们想要查询出所有的个位数为2的数据,我们用find方法查询,但是为了看下查询的状态,我们使用下面的sql,增加了explain方法

db.test.find({single_digit:2}).explain("executionStats")

explain 操作提供了查询信息,使用索引及查询统计等。有利于我们对索引的优化
executionStats顾名思义,代表的是运行时候的状态,关于explain的后续会有一个博客讲解下,这儿主要是让大家知道正常情况下运行find方法的”消耗“,方便对后面做对比。
在这里插入图片描述

executionTimeMillis 代表的是运行的时间,显示的时间是1198ms。
totalDocsExamined 代表的是我们去检查的文档的总数,正好一百万,说明人家遍历了我们整个集合。
总结一句,find方法遍历了我们的文档,并且花费了1.198s的时间去返回我们想要的数据。

接着我们进入索引的范畴。

获取索引列表

db.test.getIndexes()

在这里插入图片描述

可以看到,默认有一个索引,叫做"_id",也就是唯一id,这个可以理解,毕竟人家是唯一id,而且官网上的解释也很清晰。
在创建集合期间,MongoDB 在_id字段上创建唯一索引。该索引可防止客户端插入两个具有相同值的文档。你不能将_id字段上的index删除。
其中,v表示的是当前索引系统的版本,其余的两个参数,分别代表索引的名字还有索引的内容,看完下面的介绍,肯定就会明白的。

创建索引

现在我们已经知道有一个默认的_id索引了,接下来需要创建一个关于single_digit的索引,方便我们后续的查询。

db.test.createIndex()

结合到我们的例子中,便是

db.test.createIndex({ single_digit: 1 })

其中,single_digit代表的是我们的索引字段。
1代表该索引使用升序方式排序,-1则表示使用降序。最主要是理解到单个索引是如何使用的。

对于单字段索引和排序操作,索引键的排序顺序(升序或降序)并不重要,因为MongoDB可以从任何方向遍历索引。

在这里插入图片描述

可以看到,现在创建了一个名字叫做single_digit_1的,而由于该索引只有一个字段,所以我们称呼为单字段索引。
再有了索引的条件下,我们重新用find方法查询下db
在这里插入图片描述

可以看到,在用了索引的条件下,使用了346ms的时间,查询了十万条数据,返回了十万条数据。
至此,我们可以理解为索引就是根据特定的条件,对数据进行分类,用户根据条件查询的时候,如果击中了索引的条件,就直接使用索引去查询,这样子能节省时间。
需要注意的是,如果索引已经存在了,再创建一个相同的索引的时候,是无效的,不做例子介绍了,可以自己再创建一个“single_digit”为-1的测试下。

删除索引

有了新增,也就有了删除,尤其是索引这种很占用内存的东西上

db.test.dropIndex('single_digit_1')

在这里插入图片描述

如果是删除所有的索引,可以使用

db.test.dropIndexs()

删除索引的方法没什么需要注意的,对我们来说,有参数就是删除特定索引,没有参数就是直接删除所有的索引

重建索引

首先,让我们将刚刚的single_digit索引加回来。此时,先贴一段话

db.collection.reIndex() may only be run on standalone instances. For
most users, the db.collection.reIndex() command is unnecessary.

大概翻译过来就是,对于大部分的用户来说,reIndex是不必要的。而且reIndex在6.0之后会被废弃,所以我依旧建议看看就行。
假设下面的情况,我们的数据库中现在有100万条数据,而现在的索引,是基于当前的数据建造的,那么如果我们再加入100万条数据,我们是否要重新去创建一次索引呢?首先答案是否定的,具体可以从stats方法去查看出当前数据的状态

db.test.stats()

在这里插入图片描述

其中可以看到当前的索引大小为10MB,而更新之前的大小为5MB.建议大家自己看看stats指令的作用。
实际开发中,reIndex的作用很小,如果有参数的时候,更新的是特定的索引,用法如下

db.test.reIndex({ "single_digit_1": 1 })

而当不赋予参数之后,则表示更新全部的索引

db.test.reIndex()

请注意,更新索引的代价是很高的。需要重新遍历一次数据去重建索引,所以很不建议,尤其是新手,要更新索引,必须先问下你的boss,然后再确定找个空闲的时间更新

知道了最简单的索引的创建、删除,以及对索引的"更新",对于索引就有了大概的了解了。接下来重点放在索引的类型上。

复合索引

很多情况下,我们的查询并不是只有一个关键字段,假设一个系统中,我们要遍历出所有的广东省的男性,这时候我们的sql就需要两个条件,分别是男性以及广东省,此时就可以创建一个复合索引,如下(数据随便创建了几条)
在这里插入图片描述

db.orders.createIndex({ province: 1, gender: 1 })

复合索引中列出的字段的顺序很重要。索引将包含对文档的引用,这些文档首先按item字段的值排序,然后在该字段的每个值内item,按stock字段的值排序。有关更多信息,请参见排序顺序。
大概意思就是,当我们创建复合索引的时候,我们需要注意列出的字段的顺序。比如这儿列出的是省份,才是性别。
新手可以粗略的理解为后面使用index查询的时候,先击中省份,再击中性别,如果想要知道具体的,建议查询官网中关于mongodb的ESR。

在这里插入图片描述

复合索引能很大程度的降低查询的时间,但是有最多32个字段的限制,而且索引并不是越多越好的。过多的索引会造成很多的内存占用。

对于其他的索引类型。比如文本索引以及通配符索引,可以大概去官网查看下,如果写了,篇幅会过大,且新手没掌握的时候会云里雾里,所以我就不展开了。

最后的话

简单来说,索引的作用就是为了更快得查询数据,很多时候单字段的索引足够满足我们的需求,对于部分较为常用的数据,可以使用复合数据。
但是索引需要用到内存,本质上是将部分的数据做了处理后将其保存下来,方便我们的查询,但是盲目创建索引,会让自己的项目越来越卡顿。
如果想知道自己的sql是否使用了index,可以使用explain()指令,查看是否用的"IXSCAN"(索引查询),以及使用的是哪一个index。
在这里插入图片描述

不建议指定index的名字,所以博客中并没有指出如何设置name。

相关文章:

整理mongodb文档:索引

个人博客 整理mongodb文档:索引 个人博客,求关注,有问题的地方欢迎指出,觉得讲解的繁琐的也请指出 文章概叙 本文主要还是在shell下的操作。让大家了解下mongodb中index的用途,基本的索引的新增、查看、删除等,最后…...

EPICS libCom库(4) -- epicsTimer

epicsTimer.h描述了一个C和C timer功能。 1 C接口 1.1 epicsTimerNotify和epicsTimer /* 使用一个timer的代码必须实现epicsTimerNotify */ class LIBCOM_API epicsTimerNotify { public:enum restart_t { noRestart, restart };class expireStatus {public:LIBCOM_API expir…...

成都大运会,保障大型活动无线电安全需要…

成都大运会 7月28日,备受关注的第31届世界大学生夏季运动会在成都正式开幕。据悉,这是全球首个5G加持的智慧大运会,也是众多成熟信息技术的综合“应用场”。使用基于5G三千兆、云网、8K超高清视频等技术,在比赛现场搭建多路8K摄像…...

【Spring Boot】构建RESTful服务 — 实战:实现Web API版本控制

实战:实现Web API版本控制 前面介绍了Spring Boot如何构建RESTful风格的Web应用接口以及使用Swagger生成API的接口文档。如果业务需求变更,Web API功能发生变化时应该如何处理呢?可以通过Web API的版本控制来处理。 1.为什么进行版本控制 …...

6.Web后端开发【SpringBoot入门】

文章目录 1 SpringBoot快速入门1.1 Web分析 2. HTTP协议2.1 HTTP-概述2.1.1 介绍2.2.2 特点 2.2 HTTP-请求协议2.3 HTTP-响应协议2.3.1 格式介绍2.3.2 响应状态码 常见的相应状态码 3 WEB服务器3.1 服务器概述 1 SpringBoot快速入门 Spring的官网Spring Boot 可以帮助我们非常…...

[ubuntu]ubuntu18.04使用自带共享桌面实现vncserver连接

vncserver有很多方法比如你安装vnc4server,tightvncserver,x11vnc等都可以实现vnc局域网连接,今天使用系统共享桌面设置vnc连接 Ubuntu开启远程桌面 Ubuntu18.04使用gnome桌面环境,系统自带屏幕共享和远程登录功能,默认使用的是vino作为VNC…...

docker启用cgroup v2

要求 本人的操作系统是kali,基于debian docker info如果你这里是2那么说明启用了,如果是1,那么就未启用 对于Docker来说,Cgroups v2的使用需要满足以下条件: Linux内核版本在4.15以上。 uname -r 系统已经启用Cgro…...

Java课题笔记~ Axios

Axios 对原生的AJAX进行封装&#xff0c;简化书写。 Axios官网是&#xff1a;https://www.axios-http.cn 2.1 基本使用 axios 使用是比较简单的&#xff0c;分为以下两步&#xff1a; 引入 axios 的 js 文件 <script src"js/axios-0.18.0.js"></script…...

ip地址和地理位置有关系吗

在互联网时代&#xff0c;网络已经成为了人们生活中不可或缺的一部分。而在网络通信中&#xff0c;IP地址扮演着非常重要的角色。那么&#xff0c;IP地址和地理位置之间是否有关系呢&#xff1f;虎观代理小二二将从以下几个方面进行探讨。 一、IP地址和地理位置的基本概念 首…...

mac指定node版本 mac node版本降级 mac切换node版本

本文解决问题&#xff1a; mac指定node版本 mac切换node版本 mac node版本降级 第一步 进行nvm 安装操作 brew install nvm 执行 nvm --version nvm --version 出现zsh: command not found: nvm问题去进行配置第二步 nvm配置 1.输入: vim ~/.bash_profile 点击 i 进行插入…...

C# Windows登录界面进行截图,控制鼠标键盘等操作实现(一)

首先常规的账户进程是没办法获取登录界面的信息的&#xff0c;因为登录界面已经不在某个账户下了&#xff0c;登录界面显示了每一个账户的切换。所以得使用System权限的进程。 那么Windows系统究竟是怎么将登录界面与用户桌面隔离开的呢&#xff1f;首先先通过一些Windows操作系…...

因果推断(五)基于谷歌框架Causal Impact的因果推断

因果推断&#xff08;五&#xff09;基于谷歌框架Causal Impact的因果推断 除了传统的因果推断外&#xff0c;还有一些机器学习框架可以使用&#xff0c;本文介绍来自谷歌框架的Causal Impact。该方法基于合成控制法的原理&#xff0c;利用多个对照组数据来构建贝叶斯结构时间…...

VR全景加盟项目如何开展?如何共赢VR时代红利?

VR全景作为一个新兴蓝海项目&#xff0c;相信有着很多人刚接触VR行业的时候都会有这样的疑问&#xff1a;VR全景加盟后项目如何开展&#xff1f;今天&#xff0c;我们就从项目运营的三个阶段为大家讲解。 一、了解项目时 目前VR全景已经被应用到各行各业中去&#xff0c;学校、…...

Win10+anaconda+CUDA+pytorch+vscode配置

Win10anacondaCUDApytorchvscode配置 1.安装anaconda2.安装CUDA确认CUDA版本确认CUDA和pytorch版本安装CUDA 3.安装cudnn4.安装Pytorch5.vscode配置安装VScodevscode配置pytorch环境 1.安装anaconda 官网https://www.anaconda.com 下载安装&#xff0c;路径全英文然后记得有一…...

vue-router在vue2/3区别

构建选项区别 vue2-router const router-new VueRouter({mode:history,base:_name,})vue-next-router import { createRouter,createWebHistory} from vue-next-router const routercreateRouter({history:createHistory(/) })在上述代码中我们发现,vue2中的构建选项mode和ba…...

Apache Doris 入门教程33:统计信息

统计信息 统计信息简介​ Doris 查询优化器使用统计信息来确定查询最有效的执行计划。Doris 维护的统计信息包括表级别的统计信息和列级别的统计信息。 表统计信息&#xff1a; 信息描述row_count表的行数data_size表的⼤⼩&#xff08;单位 byte&#xff09;update_rows收…...

有效需求的特征

如何区分优秀的软件需求和软件需求规格说明书&#xff08;SRS&#xff09;与可能导致问题的需求和规格说明书&#xff1f;在这篇文章中&#xff0c;我们将首先讨论单个需求应该具有的几种不同特性。然后&#xff0c;我们将讨论成功的SRS整体应具有的理想特征。 1.有效需求的特…...

基于51单片机无线温度报警控制器 NRF24L01 多路温度报警系统设计

一、系统方案 1、本设计默认采用STC89C52单片机&#xff0c;如需更换单片机请联系客服。 2、接收板LCD1602液晶实时显示当前检测的2点温度值以及对应的上下限报警值。发射板由DS18B20采集温度值&#xff0c;通过无线模块NRF24L01传给接收板。 3、按键可以设置温度上下限值&…...

Spring Data JPA的@Entity注解

一、示例说明 rules\CouponTypeConverter.java Converter public class CouponTypeConverterimplements AttributeConverter<CouponType, String> {Overridepublic String convertToDatabaseColumn(CouponType couponCategory) {return couponCategory.getCode();}Overr…...

CANoe panel中,Path Dialog如何保存选择的文件路径

这里写目录标题 Path Dialog控件的设置系统变量和环境变量 Path Dialog控件的设置 过滤加载的文件类型 填写格式为&#xff1a;Hex file |.hex 其中Hex file为自定义name&#xff0c;.hex为你想识别的文件类型 系统变量和环境变量 系统变量&#xff1a;在canoe的Environmen…...

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…...

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件&#xff1a; 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

Java如何权衡是使用无序的数组还是有序的数组

在 Java 中,选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南: ⚖️ 核心权衡维度 维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务

通过akshare库&#xff0c;获取股票数据&#xff0c;并生成TabPFN这个模型 可以识别、处理的格式&#xff0c;写一个完整的预处理示例&#xff0c;并构建一个预测未来 3 天股价涨跌的分类任务 用TabPFN这个模型构建一个预测未来 3 天股价涨跌的分类任务&#xff0c;进行预测并输…...

什么是库存周转?如何用进销存系统提高库存周转率?

你可能听说过这样一句话&#xff1a; “利润不是赚出来的&#xff0c;是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业&#xff0c;很多企业看着销售不错&#xff0c;账上却没钱、利润也不见了&#xff0c;一翻库存才发现&#xff1a; 一堆卖不动的旧货…...

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...

保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek

文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama&#xff08;有网络的电脑&#xff09;2.2.3 安装Ollama&#xff08;无网络的电脑&#xff09;2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...

免费PDF转图片工具

免费PDF转图片工具 一款简单易用的PDF转图片工具&#xff0c;可以将PDF文件快速转换为高质量PNG图片。无需安装复杂的软件&#xff0c;也不需要在线上传文件&#xff0c;保护您的隐私。 工具截图 主要特点 &#x1f680; 快速转换&#xff1a;本地转换&#xff0c;无需等待上…...

人工智能--安全大模型训练计划:基于Fine-tuning + LLM Agent

安全大模型训练计划&#xff1a;基于Fine-tuning LLM Agent 1. 构建高质量安全数据集 目标&#xff1a;为安全大模型创建高质量、去偏、符合伦理的训练数据集&#xff0c;涵盖安全相关任务&#xff08;如有害内容检测、隐私保护、道德推理等&#xff09;。 1.1 数据收集 描…...