当前位置: 首页 > news >正文

MongoDB 介绍

一、MongoDB 介绍

MongoDB 是一个开源的、面向文档的数据库管理系统。它采用了灵活的数据模型,以类似 JSON 的文档形式存储数据,具有高可扩展性、高性能和丰富的功能。

主要特点包括:

  1. 灵活的数据模型:文档型数据库允许存储不同结构的文档,无需预先定义固定的模式。可以随时添加新的字段或修改现有字段,非常适合快速变化的应用场景。
  2. 高可扩展性:支持水平扩展,可以通过分片机制将数据分布在多个服务器上,以处理大规模数据和高并发访问。
  3. 丰富的查询语言:提供类似 SQL 的查询语言,支持复杂的查询操作,包括条件查询、排序、聚合等。同时,还支持索引以提高查询性能。
  4. 高可用性:支持副本集,可以实现数据冗余和故障转移,确保在节点故障时数据的持续可用。
  5. 支持多种编程语言:提供了丰富的驱动程序,支持多种编程语言,方便开发人员进行应用开发。

二、MongoDB 原理

  1. 存储结构:

    • MongoDB 将数据存储在文档中,文档是一种类似于 JSON 的结构,由键值对组成。文档可以包含不同类型的数据,如字符串、数字、日期、数组、嵌套文档等。
    • 数据库由多个集合组成,集合类似于关系型数据库中的表,但没有固定的模式。集合中的文档可以具有不同的结构。
    • MongoDB 使用内存映射文件进行数据存储,将数据文件映射到内存中,提高数据的读写性能。
  2. 索引机制:

    • MongoDB 支持多种类型的索引,包括单键索引、复合索引、文本索引、地理空间索引等。索引可以提高查询性能,特别是对于经常进行的查询操作。
    • MongoDB 会自动为文档的唯一标识符(_id)创建索引,也可以根据应用需求手动创建其他索引。
  3. 复制集:

    • 复制集是一组 MongoDB 服务器,其中一个服务器被指定为主服务器,其他服务器为从服务器。主服务器负责处理所有的写操作,并将数据同步到从服务器。
    • 从服务器可以提供读操作的负载均衡,提高系统的可用性和性能。如果主服务器发生故障,复制集会自动选举一个新的主服务器。
  4. 分片:

    • 分片是将数据分布在多个 MongoDB 服务器上的机制,以实现水平扩展。数据被分成多个数据块,每个数据块存储在不同的分片服务器上。
    • MongoDB 使用分片键来确定数据的分布,分片键可以是文档中的一个或多个字段。查询时,MongoDB 会根据分片键将查询路由到相应的分片服务器上。

三、以物联网存储实时数据为例讲解 MongoDB 的使用

  1. 设计数据模型:

    • 对于物联网实时数据,可以创建一个名为“sensor_data”的集合来存储传感器数据。每个文档可以包含传感器的标识、时间戳、测量值等字段。
    • 例如:
    {"sensor_id": "sensor1","timestamp": ISODate("2024-10-12T10:00:00Z"),"temperature": 25.5,"humidity": 60
    }
    
  2. 插入数据:

    • 使用 MongoDB 的驱动程序或命令行工具,可以将实时数据插入到数据库中。例如,使用 Python 的 pymongo 库:
    from pymongo import MongoClientclient = MongoClient('mongodb://localhost:27017/')
    db = client['iot_data']
    collection = db['sensor_data']data = {"sensor_id": "sensor1","timestamp": datetime.utcnow(),"temperature": 26.5,"humidity": 65
    }collection.insert_one(data)
    
  3. 查询数据:

    • 可以使用 MongoDB 的查询语言来查询特定传感器的数据或满足特定条件的数据。例如,查询传感器“sensor1”的所有数据:
    result = collection.find({"sensor_id": "sensor1"})
    for doc in result:print(doc)
    
  4. 建立索引:

    • 为了提高查询性能,可以根据经常查询的字段建立索引。例如,为“sensor_id”和“timestamp”字段建立复合索引:
    collection.create_index([("sensor_id", 1), ("timestamp", 1)])
    
  5. 数据聚合和分析:

    • MongoDB 提供了强大的聚合框架,可以对数据进行统计、分组、排序等操作。例如,计算某个时间段内传感器的平均温度:
    pipeline = [{"$match": {"sensor_id": "sensor1","timestamp": {"$gte": datetime(2024, 10, 12, 10, 0, 0),"$lt": datetime(2024, 10, 12, 11, 0, 0)}}},{"$group": {"_id": None,"average_temperature": {"$avg": "$temperature"}}}
    ]result = collection.aggregate(pipeline)
    print(result.next())
    

通过以上步骤,可以使用 MongoDB 有效地存储和处理物联网实时数据。根据实际需求,可以进一步优化数据模型、索引和查询,以提高系统的性能和可用性。

二、以下是使用 Java 代码以物联网存储实时数据为例展示 MongoDB 的使用方法:

1、添加依赖

如果使用 Maven 项目,在pom.xml文件中添加以下依赖:

<dependency><groupId>org.mongodb</groupId><artifactId>mongo-java-driver</artifactId><version>3.12.11</version>
</dependency>

2、代码示例

import com.mongodb.MongoClient;
import com.mongodb.client.MongoCollection;
import com.mongodb.client.MongoDatabase;
import org.bson.Document;import java.util.Date;public class MongoDBIoTExample {public static void main(String[] args) {// 创建 MongoDB 连接MongoClient mongoClient = new MongoClient("localhost", 27017);// 选择数据库MongoDatabase database = mongoClient.getDatabase("iot_data");// 选择集合MongoCollection<Document> collection = database.getCollection("sensor_data");// 模拟物联网传感器数据Document sensorData = new Document().append("sensor_id", "sensor1").append("timestamp", new Date()).append("temperature", 25.5).append("humidity", 60);// 插入数据到集合中collection.insertOne(sensorData);System.out.println("数据插入成功!");// 查询特定传感器的数据Document query = new Document("sensor_id", "sensor1");collection.find(query).forEach(document -> System.out.println(document.toJson()));// 关闭连接mongoClient.close();}
}

在这个示例中,首先创建了一个到本地 MongoDB 服务器的连接。然后选择了名为iot_data的数据库和名为sensor_data的集合。接着模拟了一个物联网传感器的数据,并将其插入到集合中。最后,通过查询特定传感器的 ID 来检索数据并打印输出。

三、聚合管道的概念
在 MongoDB 中,聚合管道是一种强大的工具,用于对数据进行复杂的分析和转换。以下是使用 MongoDB 的聚合管道进行数据分析的步骤:

聚合管道是由多个阶段组成的流水线,每个阶段对输入数据进行特定的操作,并将结果传递给下一个阶段。聚合管道可以处理大量的数据,并提供了丰富的操作,如过滤、分组、排序、计算聚合值等。

1、基本的聚合管道操作

  1. $match阶段:用于过滤文档,只选择符合特定条件的文档进入管道的下一个阶段。

    • 例如,选择温度大于 25 的传感器数据:
    { $match: { temperature: { $gt: 25 } } }
    
  2. $group阶段:用于将文档分组,并对每组文档进行聚合操作。

    • 例如,按传感器 ID 分组并计算平均温度:
    {$group: {_id: "$sensor_id",averageTemperature: { $avg: "$temperature" }}
    }
    
  3. $sort阶段:用于对文档进行排序。

    • 例如,按时间戳升序排序:
    { $sort: { timestamp: 1 } }
    
  4. $project阶段:用于选择和重命名字段,以及进行计算和转换。

    • 例如,选择特定字段并计算温度差:
    {$project: {sensor_id: 1,temperatureDifference: { $subtract: [ "$temperature", 25 ] }}
    }
    

使用 Java 驱动程序执行聚合管道

以下是使用 Java 驱动程序执行聚合管道的示例代码:

import com.mongodb.MongoClient;
import com.mongodb.client.AggregateIterable;
import com.mongodb.client.MongoCollection;
import com.mongodb.client.MongoDatabase;
import org.bson.Document;import java.util.Arrays;public class MongoDBAggregationExample {public static void main(String[] args) {// 创建 MongoDB 连接MongoClient mongoClient = new MongoClient("localhost", 27017);// 选择数据库MongoDatabase database = mongoClient.getDatabase("iot_data");// 选择集合MongoCollection<Document> collection = database.getCollection("sensor_data");// 定义聚合管道AggregateIterable<Document> result = collection.aggregate(Arrays.asList(new Document("$match", new Document("temperature", new Document("$gt", 25))),new Document("$group", new Document("_id", "$sensor_id").append("averageTemperature", new Document("$avg", "$temperature"))),new Document("$sort", new Document("averageTemperature", -1))));// 遍历结果for (Document document : result) {System.out.println(document.toJson());}// 关闭连接mongoClient.close();}
}

在这个示例中,首先创建了一个到本地 MongoDB 服务器的连接,并选择了名为iot_data的数据库和sensor_data集合。然后定义了一个聚合管道,包括过滤温度大于 25 的文档、按传感器 ID 分组并计算平均温度、按平均温度降序排序。最后,遍历结果并打印输出。

复杂的聚合操作

聚合管道还可以进行更复杂的操作,如嵌套分组、使用表达式进行计算、连接多个集合等。例如,可以使用$lookup阶段进行左外连接操作,将两个集合的数据关联起来进行分析。

以下是一个使用$lookup进行关联的示例:

{$lookup: {from: "sensor_metadata",localField: "sensor_id",foreignField: "sensor_id",as: "sensor_metadata"}
},
{$unwind: "$sensor_metadata"
},
{$project: {sensor_id: 1,temperature: 1,location: "$sensor_metadata.location"}
}

在这个示例中,假设存在另一个名为sensor_metadata的集合,包含传感器的元数据信息(如位置)。通过$lookup阶段将sensor_data集合与sensor_metadata集合进行关联,然后使用$unwind阶段将关联后的结果展开,最后使用$project阶段选择需要的字段。

通过灵活运用 MongoDB 的聚合管道,可以对数据进行各种复杂的分析和转换,满足不同的数据分析需求。

相关文章:

MongoDB 介绍

一、MongoDB 介绍 MongoDB 是一个开源的、面向文档的数据库管理系统。它采用了灵活的数据模型&#xff0c;以类似 JSON 的文档形式存储数据&#xff0c;具有高可扩展性、高性能和丰富的功能。 主要特点包括&#xff1a; 灵活的数据模型&#xff1a;文档型数据库允许存储不同…...

计算机网络:物理层 —— 物理层概述

文章目录 物理层功能物理层接口特性常见特性 相关概念 物理层&#xff08;Physical Layer&#xff09;是OSI&#xff08;Open Systems Interconnection&#xff09;模型的第一层&#xff0c;负责提供原始比特流传输的服务。它定义了硬件接口的电气、机械、功能和过程特性&#…...

HTTP的工作原理

HTTP&#xff08;Hypertext Transfer Protocol&#xff09;是一种用于在计算机网络上传输超文本数据的应用层协议。它是构成万维网的基础之一&#xff0c;被广泛用于万维网上的数据通信。&#xff08;超文本(Hypertext)是用超链接的方法&#xff0c;将各种不同空间的文字信息组…...

缓存数据减轻服务器压力

问题:不是所有的数据都需要请求后端的 不是所有的数据都需要请求后端的,有些数据是重复的、可以复用的解决方案:缓存 实现思路:每一个分类为一个key,一个可以下面可以有很多菜品 前端是按照分类查询的,所以我们需要通过分类来缓存缓存代码 /*** 根据分类id查询菜品** @pa…...

【自动驾驶】控制算法(十二)横纵向综合控制 | 从理论到实战全面解析

写在前面&#xff1a; &#x1f31f; 欢迎光临 清流君 的博客小天地&#xff0c;这里是我分享技术与心得的温馨角落。&#x1f4dd; 个人主页&#xff1a;清流君_CSDN博客&#xff0c;期待与您一同探索 移动机器人 领域的无限可能。 &#x1f50d; 本文系 清流君 原创之作&…...

Python基础之List列表用法

1、创建列表 names ["张三","李四","王五","Mary"] 2、列表分片 names[1]&#xff1a;获取数组的第2个元素。 names[1:3]&#xff1a;获取数组的第2、第3个元素。包含左侧&#xff0c;不包含右侧。 names[:3]等同于names[0:3]&…...

视觉检测开源库-功能包框架搭建

chapt9/chapt9_ws/src&#xff0c;接着在目录下新建 yolov5_ros2 功能包&#xff0c;并添加相关依赖&#xff0c;完整命令如下&#xff1a; ros2 pkg create yolov5_ros2 --build-type ament_python --dependencies rclpy yolov5 cv_bridge sensor_msgs vision_msgs cv2 --lic…...

pytest的基础入门

pytest判断用例的成功或者失败 pytest识别用例失败时会报AssertionError或者xxxError错误&#xff0c;当捕获异常时pytest无法识别到失败的用例 pytest的fixture夹具 pytest的参数化 #coding:utf-8 import pytestfrom PythonProject.pytest_test.funcs.guess_point import ge…...

(31)非零均值信号的时域分析:均值、方差、与功率

文章目录 前言一、使用MATLAB生成余弦波并画图二、计算信号的均值、方差、与功率三、结果分析 前言 本文对叠加了直流分量的一段整周期余弦信号进行时域分析&#xff0c;使用MATLAB进行信号生成&#xff0c;并计算其均值、方差、与功率。最后给出对计算结果的分析&#xff0c;…...

架设传奇SF时提示此服务器满员,GEE引擎点开始游戏弹出服务器满员的解决方法

昨天一个朋友在架设GEE的传奇服务端时遇到一个奇怪的问题&#xff0c;就是在服务器外网架设时&#xff0c;建好角色点开始游戏提示此服务器满员&#xff0c;这个问题一般比较少见&#xff0c;而且出现的话一般都是GEE引擎的版本。 他折腾了半天&#xff0c;一直没进游戏&#x…...

QT day06

在QT使用数据库实现学生管理系统 头文件&#xff1a; #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QSqlDatabase> #include <QSqlQuery> #include <QSqlRecord> QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAME…...

微信小程序-npm支持-如何使用npm包

文章目录 1、在内建终端中打开2、npm init -y3、Vant Weapp4、通过 npm 安装5、构建 npm 1、在内建终端中打开 Windows PowerShell 版权所有 (C) Microsoft Corporation。保留所有权利。尝试新的跨平台 PowerShell https://aka.ms/pscore6PS C:\Users\dgq\WeChatProjects\minip…...

Spring Cloud Stream 3.x+kafka 3.8整合

Spring Cloud Stream 3.xkafka 3.8整合&#xff0c;文末有完整项目链接 前言一、如何看官方文档(有深入了解需求的人)二、kafka的安装tar包安装docker安装 三、代码中集成创建一个测试topic&#xff1a;testproducer代码producer配置&#xff08;配置的格式&#xff0c;上篇文章…...

JavaScript中的数组

1.数组的概念 数组可以把一组相关的数据一起存放&#xff0c;并提供方便的访问/获取方式数组是指一组数据的集合&#xff0c;其中每个数据称之为元素(element)&#xff0c;在数组中可以存放任意类型的元素&#xff0c;数组是一种将一组数据存储在单个变量名下的优雅方式。 2.…...

UE5运行时动态加载场景角色动画任意搭配-场景角色相机动画音乐加载方法(三)

1、将场景打包为Pak并加载 1、参考这篇文章将场景打包为pak,UE4打包并加载Pak-Windows/iOS/Android不同平台Editor/Runtime不同运行模式兼容 2、在Mount Pak后直接打开Map即可 void UMapManager::OpenMap(FString Path) {UWorld* World = UGlobalManager::GetInstance()->…...

c# 中 中文、英文、数字、空格、标点符号占的字符大小

在C#中&#xff0c;中文、英文、数字、空格和标点符号在不同编码下所占的字节大小是不一样的。常见的编码有UTF-8、UTF-16、GB2312等。以下是在不同编码下各种字符类型所占的字节大小&#xff1a; UTF-8&#xff1a; 中文字符&#xff1a;3个字节 英文字符&#xff1a;1个字…...

前端_003_js扫盲

文章目录 var,let,const严格模式数据类型运算符事件常用对象函数绑定call() ,apply(),bind() 闭包浏览器中事件循环回调和异步Promiseasync和await DOMBOMAjax var,let,const let是var的升级版本&#xff0c;对于块作用域&#xff0c;var无法进行限制&#xff0c;let不会存在该…...

ValueError: You cannot perform fine-tuning on purely quantized models.

在使用peft 微调8bit 或者4bit 模型的时候&#xff0c;可能会报错&#xff1a; You cannot perform fine-tuning on purely quantized models. Please attach trainable adapters on top of the quantized model to correctly perform fine-tuning. Please see: https://huggi…...

DELL R720服务器阵列数据恢复,磁盘状态为Foreign

服务器无法正常进入系统&#xff0c;物理磁盘状态变成了Foreign 虚拟磁盘状态变成了Failed 阵列已经丢失了&#xff0c;需要手工强制导入外部配置 单击 Main Menu 屏幕上的 Configuration Management。单击 Manage Foreign Configuration 单击 Preview Foreign Configurati…...

VMDK 0X80BB0005 VirtualBOX虚拟机错误处理-数据恢复——未来之窗数据恢复

打开虚拟盘文件in7.vmdk 失败. Could not get the storage format of the medium 7\win7.vmdk (VERR_NOT_SUPPORTED). 返回 代码:VBOX_E_IPRT_ERROR (0X80BB0005) 组件:MediumWrap 界面:IMedium {a a3f2dfb1} 被召者:IVirtualBox {768 cd607} 被召者 RC:VBOX_E_OBJECT_NOT_F…...

跨设备追番终极指南:3步配置Kazumi WebDAV数据同步

跨设备追番终极指南&#xff1a;3步配置Kazumi WebDAV数据同步 【免费下载链接】Kazumi 基于自定义规则的番剧采集APP&#xff0c;支持流媒体在线观看&#xff0c;支持弹幕&#xff0c;支持实时超分辨率。 项目地址: https://gitcode.com/gh_mirrors/ka/Kazumi 还在为手…...

OpenCore Legacy Patcher完整指南:四步让老旧Mac免费升级最新macOS

OpenCore Legacy Patcher完整指南&#xff1a;四步让老旧Mac免费升级最新macOS 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 还在为苹果官方停止支持的老旧…...

终极指南:如何用Scream实现Windows音频网络共享

终极指南&#xff1a;如何用Scream实现Windows音频网络共享 【免费下载链接】scream Virtual network sound card for Microsoft Windows 项目地址: https://gitcode.com/gh_mirrors/sc/scream 想要将Windows电脑的音频无线传输到其他设备&#xff1f;厌倦了复杂的音频线…...

STM32 TIM编码器模式实战:如何精准计算步进电机闭环控制的脉冲对应关系?

STM32 TIM编码器模式实战&#xff1a;步进电机闭环控制中的脉冲精确换算 步进电机在工业自动化、3D打印和精密仪器中扮演着关键角色&#xff0c;而闭环控制则是确保其运动精度的核心技术。许多工程师在实现闭环控制时&#xff0c;常常困惑于如何准确建立编码器脉冲与电机控制脉…...

高效突破语言壁垒:KISS Translator的全场景翻译解决方案

高效突破语言壁垒&#xff1a;KISS Translator的全场景翻译解决方案 【免费下载链接】kiss-translator A simple, open source bilingual translation extension & Greasemonkey script (一个简约、开源的 双语对照翻译扩展 & 油猴脚本) 项目地址: https://gitcode.c…...

G-Helper终极指南:释放华硕笔记本全部潜力的轻量级控制工具

G-Helper终极指南&#xff1a;释放华硕笔记本全部潜力的轻量级控制工具 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Stri…...

【技术突破】douyin-downloader:重新定义抖音内容采集效率的智能引擎

【技术突破】douyin-downloader&#xff1a;重新定义抖音内容采集效率的智能引擎 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser …...

N8N不只是工作流工具:手把手教你把它变成双向MCP网关,连接百度地图和AI Agent

N8N架构实战&#xff1a;构建双向MCP网关连接百度地图与AI Agent生态 在AI Agent技术栈中&#xff0c;协议桥接能力正成为系统设计的核心挑战。当Claude需要调用地图服务、Cursor尝试接入CRM数据时&#xff0c;传统API集成方式往往需要编写大量适配代码。而N8N通过独特的双向MC…...

4个硬核特性解决开发者存储管理难题

4个硬核特性解决开发者存储管理难题 【免费下载链接】czkawka Multi functional app to find duplicates, empty folders, similar images etc. 项目地址: https://gitcode.com/GitHub_Trending/cz/czkawka 一、存储困境诊断&#xff1a;开发者面临的四大存储挑战 识别…...

Tree of Thoughts终极指南:5分钟掌握思维树算法原理与实战应用

Tree of Thoughts终极指南&#xff1a;5分钟掌握思维树算法原理与实战应用 【免费下载链接】tree-of-thought-llm [NeurIPS 2023] Tree of Thoughts: Deliberate Problem Solving with Large Language Models 项目地址: https://gitcode.com/gh_mirrors/tr/tree-of-thought-l…...