当前位置：首页 > news >正文

springboot Mongo大数据查询优化方案

news 2026/5/23 20:19:33

前言

因为项目需要把传感器的数据保存起来，当时设计的时是mongo来存储，后期需要从mongo DB里查询传感器的数据记录。由于传感器每秒都会像mongo数据库存500条左右的数据，1天就有4320万条数据，要想按照时间条件去查询，经常会被卡死。以下是我的解决过程和方案。

解决方案

水平分表

按照传感器类型分表

将不同不同传感器的数据，分别存入不同的表（集合）中，这样每个表的数据就成倍减少，但是过了一段时间发现查询嗨是很慢，每个传感器每秒需要保存的数据也有100条左右，一天就是864万条数据。仅靠类型分表是不行的。

按照日期分表

每个表每天的数据有864万条数据，一个月就是2.6亿条数据。于是按照日期，每天对每个传感器类型建设了一个表表（集合）名格式如 ‘temperature_sensor_20240310’。
如保存数据时候自动创建分表代码如下：

    @Asyncpublic <T> void insertSharding(Collection<? extends T> batchToSave, String collectionName) {String collectionNameSharding = collectionName + "_" + DateUtil.today();if (CollectionUtil.isNotEmpty(batchToSave)) {mongoTemplate.insert(batchToSave, collectionNameSharding);}}

DateUtil.today() 是我工具类里的方法等效于 DateUtil.format(new Date(),“yyyyMMdd”)
注意请保证每个传入的对象里都有一个createTime字段，查询的时候会用到

按照时间查询分表的方法，代码如下：

    public <T> List<T>  getSecondData(LocalDateTime start, LocalDateTime end, Class<T> entityClass, String collectionName) {String collectionNameSharding =collectionName+"_"+DateUtil.format(start,"yyyyMMdd");// 设置时间范围查询条件Criteria criteria = Criteria.where("createTime").gte(start).lte(end);// 查询数据return mongoTemplate.find(Query.query(criteria).limit(1000).skip(0), entityClass,collectionNameSharding);}

代码中的 .limit(1000) 表示限制查询结果的数量，即最多返回1000条匹配的文档记录。这对于分页查询或者批量处理数据时非常有用，可以避免一次性加载过多数据导致内存溢出或响应延迟。
而 .skip(0) 则表示跳过前0条匹配的文档记录，从第一条开始返回。在分页查询场景下，如果你想获取第二页的数据，通常会将skip的参数设置为每页大小（假设也是1000），即 .skip(1000)，这样就会跳过前1000条，然后取接下来的1000条数据。

经过以上操作查询数据的时候不会被卡顿了，但是查询速度需要2s左右,项目需求查询速度至少得在200ms内，所以还得继续优化。

建立索引

因为mongo水平分表的缘故，不可能人工去对每个字段创建的表（集合）去建立时间索引，需要代码实现，创建表的同时，自动创建时间索引。

修改分表数据保存方法如下：

  @Asyncpublic <T> void insertSharding(Collection<? extends T> batchToSave, String collectionName) {String collectionNameSharding = collectionName + "_" + DateUtil.today();if (!mongoTemplate.collectionExists(collectionNameSharding)) {mongoTemplate.createCollection(collectionNameSharding);IndexOperations indexOps = mongoTemplate.indexOps(collectionNameSharding);indexOps.ensureIndex(new Index().on("createTime", Sort.Direction.ASC).named(collectionNameSharding+"_createTime"));}if (CollectionUtil.isNotEmpty(batchToSave)) {mongoTemplate.insert(batchToSave, collectionNameSharding);}}

named(collectionNameSharding+“_createTime”)) 即创建索引的名称
on(“createTime”, Sort.Direction.ASC) 即使用集合中的createTime字段按照升序建立索引。

总结

经过以上水平分表和建立索引的方法，按照时间条件去查询的方法已经可以优化到200ms左右了。本篇教程到此未知，如果觉得不错，记得一键三连，感谢各位的支持！！！

springboot Mongo大数据查询优化方案

前言

解决方案

水平分表

按照传感器类型分表

按照日期分表

建立索引

总结

相关文章：

springboot Mongo大数据查询优化方案

Ollama管理本地开源大模型，用Open WebUI访问Ollama接口

Linux--基本知识入门

基于springboot+vue实现的大学计算机课程管理平台的设计与实现(全套资料)

LeetCode2115. 从给定原材料中找到所有可以做出的菜

项目性能优化—性能优化的指标、目标

蓝桥杯刷题（三）

20240312-算法复习打卡day21||● 530.二叉搜索树的最小绝对差 ● 501.二叉搜索树中的众数 ● 236. 二叉树的最近公共祖先

今天我们来学习一下关于MySQL数据库

长期护理保险可改善老年人心理健康 | CHARLS CLHLS CFPS 公共数据库周报（3.6）...

49、C++/友元、常成员函数和常对象、运算符重载学习20240314

SQL Server错误：15404

Halcon文件操作

【测试知识】业务面试问答突击版1

使用el-row及el-col页面缩放时出现空行解决方案

java中几种对象存储（文件存储）中间件的介绍

网络工程师——2024自学

SwiftUI的Picker

物联网技术助力智慧城市转型升级：智能、高效、可持续

YOLOv7_pose-Openvino和ONNXRuntime推理【CPU】

DS89C420片上SRAM的启用与配置详解

VutronMusic：构建现代化跨平台音乐播放器的技术实现方案

终极指南：5分钟搭建Rust高性能HTTP文件服务器，告别繁琐配置

在 Taotoken 平台管理账单与下载历史消费记录的便利性

聚焦养老服务管理以 AI 课堂革新实训教学模式

简单说明--程序系统如何对用户身份证实名认证接口api

如何解决跨平台资源下载难题：res-downloader的完整使用指南

【纳瓦尔宝典】财富篇精读：程序员实现财富自由的底层逻辑

别再手动刷新了！用HomePage v0.8.2+Docker Compose，一键监控所有容器和网站状态

ENSP实验避坑指南：搭建园区网时，VLAN间通信、MSTP负载分担、VRRP主备切换这些细节你配对了吗？