当前位置: 首页 > news >正文

秋招Java后端开发冲刺——非关系型数据库篇(Redis)

在这里插入图片描述

一、非关系型数据库

1. 主要针对的是键值、文档以及图形类型数据存储。
2. 特点

特点说明
灵活的数据模型支持多种数据模型(文档、键值、列族、图),无需预定义固定的表结构,能够处理各种类型的数据。
高扩展性设计为水平扩展,能够轻松地通过增加更多节点来处理大量的数据和高并发请求。
高性能通过优化特定类型的查询和数据操作,通常比关系型数据库在大规模数据处理时表现更好。
分布式架构天生支持分布式存储和计算,能够跨多个节点和数据中心实现数据的分布和冗余。
弱一致性为了提高性能和可用性,通常采用最终一致性模型,而不是关系型数据库的强一致性模型。
灵活的事务支持事务支持通常较为灵活,有些NoSQL数据库提供有限的事务支持,有些则支持ACID事务。
易于使用简单的API接口和查询语言,使开发者能够快速上手和使用。
丰富的类型支持能够存储和处理多种数据类型,包括JSON、XML、二进制数据等。
高可用性通过数据复制和分区,实现高可用性和数据冗余,保证系统在部分节点失效时仍能正常运行。
适应多种应用场景特别适合于大数据分析、实时应用、社交网络、物联网等需要处理大量非结构化数据的场景。

3. 代表:HBase、Cassandra、MongoDB、Redis

二、Redis

Redis是一个基于 C 语言开发的开源 NoSQL 数据库,使用key-value键值对存储数据,且由于其数据存储在内存中,速度很快,在开发中使用广泛。

(一)数据类型

1. 五种基础数据类型
五种基础数据类型包括:String(字符串)、List(列表)、Set(集合)、Hash(散列)、Zset(有序集合)

  • String:是一种二进制安全的数据类型,常用于缓存 Session、Token、图片地址、序列化后的对象,用户单位时间的请求数(简单限流可以用到)、页面单位时间的访问数
  • List:使用一个双向链表实现,常用于实现最新文章、最新动态、消息队列
  • Hash:是一个 String 类型的 field-value(键值对) 的映射表,内部实现:数组 + 链表,常用于存储对象
  • Set:是一种无序集合,实现了求交集、并集、差集等操作,常用于网站 UV 统计、文章点赞、动态点赞等场景;共同好友(交集)、共同粉丝(交集)、共同关注(交集)、好友推荐(差集)、音乐推荐(差集)、订阅号推荐(差集+交集) 等场景;抽奖系统、随机点名等场景
  • Sorted Set:增加了一个权重参数 score,底层使用跳表实现,使得集合中的元素能够按 score 进行有序排列,常用于各种排行榜,优先级任务队列

2. 三种特殊数据类型
包括:HyperLogLog(基数统计)、Bitmap (位图)、Geospatial (地理位置)

  • Bitmap:存储的是连续的二进制数字(0 和 1),常用于用户签到情况、活跃用户情况、用户行为统计(比如是否点赞过某个视频)。
  • HyperLogLog:是一种有名的基数计数概率算法,常用于数据量巨大的统计场景:热门网站每日/每周/每月访问 ip 数统计、热门帖子 uv 统计等
  • Geospatial index(地理空间索引,简称 GEO):基于 Sorted Set 实现,主要用于存储地理位置信息。

3. 其他数据类型
包括: Bloom filter(布隆过滤器)、Bitfield(位域)

  • Bloom filter(布隆过滤器):由一个初始值为零的bit数组和多个哈希函数构成,用来快速判断集合中是否存在某个元素,常用于解决缓存穿透问题
  • Bitfield(位域):是一种对Redis中的字符串类型进行扩展的数据类型,用于对字符串中任意偏移进行修改等操作。
(二)应用

在这里插入图片描述

(三)常见面试问题

1. 为什么快

  • Redis 基于内存存储数据,内存的访问速度比磁盘快很多
  • Redis 基于 Reactor 模式设计开发了一套高效的事件处理模型,使用IO多路复用+事件派发来处理多个socket
  • Redis是单线程的,避免线程间的切换(Redis6.0之后命令回复处理器、命令请求处理器使用了多线程,命令执行还是使用的单线程)
  • Redis 内置了多种优化过后的数据类型/结构实现,性能非常高
  • Redis 通信协议实现简单且解析高效

2. 缓存读写策略
(1)Cache Aside Pattern(旁路缓存模式)

  • 读数据:从 cache 中读取数据,读取到就直接返回;否则从 db 中读取数据返回,再把数据放到 cache 中
  • 写数据:先更新db,再删除缓存
    (2)Read/Write Through Pattern(读写穿透)(以cache服务器为主)
  • 读数据:从 cache 中读取数据,读取到就直接返回 ;否则先从 db 加载,写入到 cache 后返回响应
  • 写数据:先查 cache,cache 中不存在,直接更新 db;cache 中存在,则先更新 cache,然后 cache 服务自己更新 db
    (3)Write Behind Pattern(异步缓存写入)
  • 只同步更新缓存,不直接更新 db,而是改为异步批量的方式来更新 db
  • db 的写性能非常高,非常适合一些数据经常变化又对数据一致性要求没那么高的场景,比如浏览量、点赞量

3. key过期删除策略

  • 惰性删除:使用时才检查删除(内存消耗大)
  • 定期删除:周期性地随机从设置了过期时间的 key 中抽查一批,然后逐个检查这些 key 是否过期,过期就删除 key(周期时间确定较难)
  • 延迟队列:把设置过期时间的 key 放到一个延迟队列里,到期之后就删除 key(需要额外的资源维护队列)
  • 定时删除:每个设置了过期时间的 key 都会在设置的时间到达时立即被删除(每个key都要维护一个定时器,资源消耗大)
    :Redis采用惰性+定期删除的方式

4. Redis 的内存淘汰策略(内存不足时触发)

  • volatile-lru(least recently used):从已设置过期时间的数据集中挑选最近最少使用的数据淘汰。
  • volatile-ttl:从已设置过期时间的数据集中挑选将要过期的数据淘汰
  • volatile-random:从已设置过期时间的数据集中任意选择数据淘汰。
  • volatile-lfu(least frequently used):从已设置过期时间的数据集中挑选最不经常使用的数据淘汰
  • allkeys-lru(least recently used):从数据集中移除最近最少使用的数据
  • allkeys-random:从数据集中任意选择数据淘汰。
  • allkeys-lfu(least frequently used):从数据集中移除最不经常使用的数据淘汰
  • no-eviction(默认内存淘汰策略):不淘汰数据,当内存不足以容纳新写入数据时,新写入操作会报错

5. 生产问题(缓存三兄弟)
(1)缓存穿透

  • 请求的 key 不存在于缓存中,会导致大量查询请求直接到了数据库,导致数据库崩溃
  • 解决方式
    ① 缓存无效值(内存不友好)
    ② 布隆过滤器(使用一个较大的 bit 数组来保存所有可能请求的key的哈希值,每次请求时计算key对应的哈希值,如果哈希值对应的位置为true才去缓存中查找)
    (2)缓存击穿
  • 请求的key对应的是热点数据 ,但缓存中的那份数据已经过期,导致大量请求落在数据库上
  • 解决方法:
    ① 设置热点数据永不过期或者过期时间比较长(内存不友好)
    ② 提前预热(推荐):针对热点数据提前预热,将其存入缓存中并设置合理的过期时间比如秒杀场景下的数据在秒杀结束之前不过期
    ③ 加锁:在缓存失效后,通过设置互斥锁确保只有一个请求去查询数据库并更新缓存
    (3)缓存雪崩
  • 缓存中的key在同一时间大量失效,导致大量的请求都直接落到了数据库上,对数据库造成了巨大的压力/Redis服务器宕机
  • 解决方式:
    ① key设置随机失效时间
    ② 提前预热
    ③ 多级缓存:设置多级缓存,例如本地缓存+Redis 缓存的二级缓存组合
    ④ Redis 集群:采用 Redis 集群,避免单机出现问题整个缓存服务都没办法使用

6. Redis集群
(1)主从复制

  • 主节点写,多个从节点读
  • 主从数据同步原理
    ① 全量同步:初始同步都采用全量同步
    ② 增量同步:一般是slave重启或者后期数据变化
  • 实现高并发
    (2)哨兵模式
  • 使用哨兵检测集群中各个服务器的状态(心跳机制),并在主节点宕机后重新选择主节点
  • 哨兵选主规则:优先级、与主节点断开时间(小)、offset值(大)、id(小)
  • 可能会出现脑裂问题(网络问题导致),解决方法是:设置最少的从节点数量/缩短主从数据同步的延迟时间/达不到要求就拒绝请求
  • 实现高可用
    (3)分片集群
  • 多个master、多个slave,多个master之间通过ping检测彼此健康状态;客户端请求可以访问任意节点,最终会根据Redis中的路由转发到正确节点
  • 实现海量数据存储,以及高并发写

7. 持久化机制
(1)快照RDB

  • 通过创建快照来获得存储在内存里面的数据在某个时间点上的副本
  • 优点:
    ① RDB 文件存储的内容是经过压缩的二进制数据,文件很小,适合做数据的备份,灾难恢复
    ② 使用 RDB 文件恢复数据,直接解析还原数据即可,不需要一条一条地执行命令,速度非常快
  • 实现原理:bgsave命令开始时主进程会fork一个子进程,子进程复制主进程的页表,将对应的内存数据写入磁盘
  • 对数据丢失容忍度更高,追求启动速度
    (2)只追加文件AOF
  • 将每一条Redis执行命令写入到 AOF 缓冲区中,然后再写入到 AOF 文件中,最后根据持久化方式( fsync策略)的将系统内核缓存区的数据同步到硬盘中
  • 优点
    ① 实时性更好
    ② AOF 以一种易于理解和解析的格式包含所有操作的日志,可以直接进行操作和分析
  • 对数据的安全性、完整性要求更高
  • 持久化策略
    ① appendfsync always:主线程调用 write 执行写操作后,后台线程( aof_fsync 线程)立即会调用 fsync 函数同步 AOF 文件(刷盘),fsync 完成后线程返回
    ② appendfsync everysec:主线程调用 write 执行写操作后立即返回,由后台线程( aof_fsync 线程)每秒钟调用 fsync 函数(系统调用)同步一次 AOF 文件
    ③ appendfsync no:主线程调用 write 执行写操作后立即返回,让操作系统决定何时进行同步刷盘
  • AOF文件重写(当文件较大时):由一个子进程将数据库状态写入新的AOF文件中,重写期间,Redis 还会维护一个 AOF 重写缓冲区,该缓冲区会在子进程创建新 AOF 文件期间,记录服务器执行的所有写命令。当子进程完成创建新 AOF 文件的工作之后,服务器会将重写缓冲区中的所有内容追加到新 AOF 文件的末尾。
    :该操作不不需要对原有AOF文件进行任何的读取,写入,分析
    (3)混合方式
  • AOF 重写的时候就直接把 RDB 的内容写到 AOF 文件开头
  • 优点:可以结合 RDB 和 AOF 的优点, 快速加载同时避免丢失过多的数据
  • 缺点:AOF 里面的 RDB 部分是压缩格式不再是 AOF 格式,可读性较差

8. Redis实现延时
(1)Redis 过期事件监听

  • 原理:在pub/sub 模式下,监听 key 的过期事件 channel,就可以拿到过期的 key 的消息,进而实现了延时任务功能
  • 存在问题
    ① 时效性差,key过期后的删除是惰性删除+定期删除结合,而这个发布者是要在key删除时才发布消息到channel
    ② 丢消息:当没有订阅者时,消息会被直接丢弃,在 Redis 中不会存储该消息
    ③ 多服务实例下消息重复消费
    (2)Redisson 内置的延时队列
  • 原理:基于 Redis 的 SortedSet 来实现,将需要延迟执行的任务插入到 SortedSet 中,并给它们设置相应的过期时间作为分数,Redisson 使用 zrangebyscore 命令扫描 SortedSet 中过期的元素,然后将这些过期元素从 SortedSet 中移除,并将它们加入到就绪消息列表中

9. Redis实现分布式锁
(1)SETNX(SET if Not eXists)命令实现分布式锁
(2)使用Redisson实现的分布式锁

  • 基于lua脚本完成加锁、设置过期时间等操作,使用watch-dog给锁续期
  • 不能实现主从一致性,使用红锁可以,但性能极差

相关文章:

秋招Java后端开发冲刺——非关系型数据库篇(Redis)

一、非关系型数据库 1. 主要针对的是键值、文档以及图形类型数据存储。 2. 特点: 特点说明灵活的数据模型支持多种数据模型(文档、键值、列族、图),无需预定义固定的表结构,能够处理各种类型的数据。高扩展性设计为水…...

个人对JVM的一点理解

JVM(Java 虚拟机)是 Java 程序能够跨平台运行的关键。它负责将 Java 字节码转换为机器码并执行。 JVM 主要由类加载器、运行时数据区、执行引擎和本地方法接口等部分组成。运行时数据区包括方法区、堆、虚拟机栈、本地方法栈和程序计数器等。 GC&#xf…...

Flutter【组件】可折叠文本组件

简介 flutter 可折叠文本组件。 点击展开,收起折叠文本。支持样式自定义 github地址: github.com/ThinkerJack… pub地址:https://pub.dev/packages/jac_uikit 展开收起文本 使用方式: ExpandableText(content: 测试 * 50,ma…...

内容安全复习 7 - 对抗攻击与防御

文章目录 概述攻击对抗性攻击的目的攻击的损失函数如何攻击FGSM黑盒与白盒真实世界的攻击 防御被动防御主动防御 概述 动机 (1)不仅要在实验室中部署机器学习分类器,也要在现实世界中部署;实际应用 (2)分类…...

淘宝店铺商家订单API-接入ERP,多平台订单同步的利器

淘宝开放平台给商家们提供了丰富的API,以方便大家扩展业务流程。但是需要调用这些API,商家们要提交资质审核,审核条件也是很严格的。第三方数据公司的存在可以为大家解决这个问题。 custom-自定义API操作 请求参数 请求参数:ap…...

【微前端-Single-SPA、qiankun的基本原理和使用】

背景 在实际项目中,随着日常跌倒导致的必然墒增,项目会越来越冗余不好维护,而且有时候一个项目会使用的其他团队的功能,这种跨团队不好维护和管理等等问题,所以基于解决这些问题,出现了微前端的解决方案。…...

多元化功能空间,打造影像产业生态圈

国际数字影像产业园的多元化功能空间定位涵盖了从产业实训、研发创新、资产交易、集群发展到孵化服务、大数据支持、产学研合作以及人力资源服务等多个方面,旨在为数字影像产业提供全方位的支持和服务,推动产业的升级和发展。 1、产业实训空间&#xff1…...

华为鸿蒙正式杀入工业自动化,反攻开始了!

导语 大家好,我是社长,老K。专注分享智能制造和智能仓储物流等内容。 新书《智能物流系统构成与技术实践》 在近日举行的2024华为开发者大会上,华龙讯达与华为共同发布了基于鸿蒙内核技术的“HualongOS 华龙工业操作系统”,这一里…...

学历优先还是专业优先?高考志愿填报的抉择

学历优先还是专业优先?高考志愿填报的抉择 2024年高考帷幕落下,新一轮的思考与选择悄然来临。对于每一位高考考生,选择学校和专业是开启大学新生活的两个前置必选项。然而,有时候“鱼与熊掌不可兼得”,在分数受限的情…...

SpringAOP常用功能实现

1. 导入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId> </dependency> 2. 核心通知 package com.example.aspect;import lombok.SneakyThrows; import org.aspectj.l…...

Java基础的重点知识-04-封装

文章目录 面向对象思想封装 面向对象思想 在计算机程序设计过程中&#xff0c;参照现实中事物&#xff0c;将事物的属性特征、行为特征抽象出来&#xff0c;描述成计算机事件的设计思想。 面向对象思想的三大基本特征: 封装、继承、多态 1.类和对象 类是对象的抽象&#xff…...

win7 的 vmware tools 安装失败

没有安装vmware tools的系统屏幕显示异常。桌面是比较小的图像&#xff0c;四周是黑边在 vmware 软件里 方法1&#xff0c;下补丁 https://www.catalog.update.microsoft.com/Search.aspx?qkb4474419 方法2&#xff0c;使用老版vm tools http://softwareupdate.vmware.com/c…...

【杂记-浅谈OSPF协议之IR、ABR、ASBR、BR】

OSPF协议之IR、ABR、ASBR、BR 一、 内部路由器 IR二、骨干路由器 BR三、边界路由器 ABR四、自治系统边界路由器 ASBR 一、 内部路由器 IR 概念 IR&#xff0c;Internal Router&#xff0c;即内部路由器&#xff0c;指的是所有接口都属于同一个OSPF区域的路由器。这类路由器只维…...

element 问题整合

没关系&#xff0c;凡事发生必有利于我 文章目录 一、el-table 同级数据对齐及展开图标的位置问题二、el-table 勾选框为圆角及只能勾选一个 一、el-table 同级数据对齐及展开图标的位置问题 element 官方提供的扩展tree型数据在表格里默认是靠左边对齐&#xff0c;项目需求需要…...

Linux下vi文件的时候替换指定的内容

需要将nginx.conf中的192.168.222.188&#xff0c;替换为178.21.120.225 操作步骤&#xff1a; 1、vi 文件 vi nginx.conf2、输入 :%s/192.168.222.188/178.21.120.225/g3、最后保存 :wq...

【知识学习】阐述Unity3D中MaterialTexture的概念及使用方法示例

在Unity3D中&#xff0c;Material和Texture是渲染过程中非常重要的两个概念&#xff0c;它们共同工作以实现丰富的视觉效果。 Material Material是Unity中的一个组件&#xff0c;用于定义物体表面的视觉属性。一个Material可以包含多种属性&#xff0c;如颜色、纹理、反射率等…...

java创建0byte的空文件

在Java中&#xff0c;使用File类创建一个文件通常不会自动创建一个0字节的文件&#xff0c;它只是用来表示文件系统中的一个文件或目录。如果你想要创建一个0字节的文件&#xff0c;你需要使用FileOutputStream来写入文件。以下是创建一个0字节文件的示例代码&#xff1a; imp…...

Qt 实战(6)事件 | 6.2、事件过滤器

文章目录 一、事件过滤器1、什么是事件过滤器&#xff1f;2、如何实现事件过滤器&#xff1f;3、应用示例4、总结 前言&#xff1a; 在Qt的事件处理机制中&#xff0c;事件过滤器&#xff08;Event Filter&#xff09;是一种非常强大且灵活的工具&#xff0c;它允许开发者在一个…...

【PyTorch】【机器学习】图片张量、通道分解合成和裁剪

一、导入所需库 from PIL import Image import torch import numpy as np import matplotlib.pyplot as plt二、读取图片 pic np.array(Image.open(venice-boat.jpg))上述代码解释&#xff1a;先用Image.open()方法读取jpg格式图片&#xff0c;再用np.array()方法将图片转成…...

如何提高工业交换机的电源功耗?

工业交换机的电源功耗是指在工作状态下所消耗的能量。随着工业自动化技术的发展&#xff0c;工业交换机在生产和制造领域中扮演着至关重要的角色。它们通过连接各种设备和系统&#xff0c;实现信息的传输和处理&#xff0c;提高生产效率和质量。然而&#xff0c;工业交换机的大…...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…...

React 第五十五节 Router 中 useAsyncError的使用详解

前言 useAsyncError 是 React Router v6.4 引入的一个钩子&#xff0c;用于处理异步操作&#xff08;如数据加载&#xff09;中的错误。下面我将详细解释其用途并提供代码示例。 一、useAsyncError 用途 处理异步错误&#xff1a;捕获在 loader 或 action 中发生的异步错误替…...

docker详细操作--未完待续

docker介绍 docker官网: Docker&#xff1a;加速容器应用程序开发 harbor官网&#xff1a;Harbor - Harbor 中文 使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像 是什么 Docker 是一种开源的容器化平台&#xff0c;用于将应用程序及其依赖项&#xff08;如库、运行时环…...

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件&#xff1a; 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

Java如何权衡是使用无序的数组还是有序的数组

在 Java 中,选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南: ⚖️ 核心权衡维度 维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

测试markdown--肇兴

day1&#xff1a; 1、去程&#xff1a;7:04 --11:32高铁 高铁右转上售票大厅2楼&#xff0c;穿过候车厅下一楼&#xff0c;上大巴车 &#xffe5;10/人 **2、到达&#xff1a;**12点多到达寨子&#xff0c;买门票&#xff0c;美团/抖音&#xff1a;&#xffe5;78人 3、中饭&a…...

【HTML-16】深入理解HTML中的块元素与行内元素

HTML元素根据其显示特性可以分为两大类&#xff1a;块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...

vue3+vite项目中使用.env文件环境变量方法

vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量&#xff0c;这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...

初探Service服务发现机制

1.Service简介 Service是将运行在一组Pod上的应用程序发布为网络服务的抽象方法。 主要功能&#xff1a;服务发现和负载均衡。 Service类型的包括ClusterIP类型、NodePort类型、LoadBalancer类型、ExternalName类型 2.Endpoints简介 Endpoints是一种Kubernetes资源&#xf…...