当前位置: 首页 > news >正文

数据库与存储优化

一、MySQL深度优化
  1. 索引优化

    • B+树索引结构

      • 结构特点
        • 平衡多路搜索树,所有数据存储在叶子节点,非叶子节点仅存键值和指针。
        • 叶子节点通过双向链表连接,支持范围查询高效遍历。
      • 优势
        • 减少磁盘IO(高扇出,3~4层可存储千万级数据)。
        • 适合范围查询(如WHERE id BETWEEN 100 AND 200)。
    • 覆盖索引

      • 定义:索引包含查询所需的所有字段,无需回表。
      • 示例
        -- 创建覆盖索引 
        CREATE INDEX idx_cover ON user(name, age); 
        -- 查询命中覆盖索引 
        SELECT name, age FROM user WHERE name = 'Alice';

    • 索引下推(ICP)

      • 原理:在存储引擎层过滤数据,减少回表次数。
      • 触发条件
        • 查询条件包含索引列和非索引列。
        • 需在WHERE子句中使用索引前缀。
      • 查看ICP优化
        EXPLAIN SELECT * FROM user WHERE name = 'Alice' AND age > 20; -- Extra列显示"Using index condition"

  2. 锁机制

    • 意向锁(Intention Locks)

      • 作用:快速判断表中是否存在行级锁,避免全表扫描。
      • 类型
        • 意向共享锁(IS):事务准备加行级共享锁。
        • 意向排他锁(IX):事务准备加行级排他锁。
    • 间隙锁(Gap Locks)

      • 功能:锁定索引记录间的间隙,防止幻读(Phantom Read)。
      • 示例
        -- 对id范围(5,10)加间隙锁 
        SELECT * FROM user WHERE id > 5 AND id < 10 FOR UPDATE;

    • 死锁排查

      • 步骤
        1. 执行SHOW ENGINE INNODB STATUS,查看LATEST DETECTED DEADLOCK
        2. 分析WAITING FOR THIS LOCKHOLDS THE LOCK信息。
      • 解决
        • 调整事务顺序,缩短事务时间。
        • 使用innodb_deadlock_detect = ON(默认开启)自动检测。
  3. 分库分表

    • ShardingSphere分片策略
      • 取模分片user_id % 4,数据均匀分布,但扩容需迁移数据。
      • 范围分片:按时间或ID范围分片,易导致数据倾斜。
      • 基因法路由
        • 原理:将关联数据(如订单和订单明细)的基因值(如用户ID哈希)嵌入分片键,确保关联查询在同一分片。
        • 示例
          -- 订单表分片键 = user_id % 8 
          -- 订单明细表分片键 = (order_id的基因部分) % 8


二、大数据存储优化
  1. HBase

    • LSM树结构

      • 写入流程
        1. 数据先写入内存(MemStore)。
        2. MemStore满后刷写到磁盘(HFile)。
        3. 后台合并(Compaction)HFile,减少文件数。
      • 优势:高吞吐写入,适合时序数据。
    • Region分裂机制

      • 触发条件:Region大小超过阈值(默认10GB)。
      • 分裂策略
        • IncreasingToUpperBound:动态调整分裂阈值。
        • Disabled:手动控制分裂。
    • RowKey设计

      • 原则
        • 散列化:避免热点(如MD5(user_id).substr(0,4) + user_id)。
        • 有序性:时间戳反转(Long.MAX_VALUE - timestamp)。
      • 示例
        RowKey = 盐值(4位) + 用户ID + 时间戳反转

  2. Elasticsearch

    • 倒排索引

      • 结构:词项(Term) → 文档ID列表。
      • 优化
        • 使用keyword类型避免分词开销。
        • 合并段(Force Merge)减少查询时的段数量。
    • 分词器原理

      • 标准分词器:按空格和标点切分,过滤停用词。
      • IK分词器
        • ik_smart:粗粒度切分(如“清华大学” → “清华大学”)。
        • ik_max_word:细粒度切分(如“清华大学” → “清华”,“大学”)。
      • 自定义词典
        PUT /my_index
        {"settings": {"analysis": {"analyzer": {"my_ik": {"type": "custom","tokenizer": "ik_max_word","filter": ["my_stopwords"]}},"filter": {"my_stopwords": {"type": "stop","stopwords": ["的", "是"]}}}}
        }
        

    • DSL优化技巧

      • 避免深分页:使用search_after代替from/size
      • 过滤器上下文:将term查询放入filter,利用缓存。
      • 冷热数据分离:按时间范围分索引,热数据使用SSD存储。
      GET /logs-2023/_search
      {"query": {"bool": {"filter": [{ "range": { "@timestamp": { "gte": "now-1d/d" }}}]}},"sort": [{"@timestamp": "desc"}],"size": 10,"search_after": [1698765432000]
      }
      


三、总结与实战建议
  • MySQL优化重点

    • 索引设计遵循最左前缀原则,避免冗余索引。
    • 分库分表优先考虑基因法路由,减少跨分片查询。
  • HBase核心实践

    • RowKey设计需平衡散列与查询需求。
    • 预分区(Pre-split)避免自动分裂带来的性能波动。
  • Elasticsearch调优

    • 使用_bulk接口批量写入,提升吞吐量。
    • 定期清理旧索引,结合ILM(索引生命周期管理)自动化。

通过结合业务场景选择合适的存储方案,并持续监控关键指标(如MySQL的QPS、Elasticsearch的段合并频率),可显著提升系统性能和稳定性。

相关文章:

数据库与存储优化

一、MySQL深度优化 索引优化 B树索引结构 结构特点&#xff1a; 平衡多路搜索树&#xff0c;所有数据存储在叶子节点&#xff0c;非叶子节点仅存键值和指针。叶子节点通过双向链表连接&#xff0c;支持范围查询高效遍历。 优势&#xff1a; 减少磁盘IO&#xff08;高扇出&#…...

Android15请求动态申请存储权限完整示例

效果: 1.修改AndroidManifest.xml增加如下内容: <uses-permission android:name="android.permission.MANAGE_EXTERNAL_STORAGE" /><uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" /><uses-perm...

C/C++蓝桥杯算法真题打卡(Day3)

一、P8598 [蓝桥杯 2013 省 AB] 错误票据 - 洛谷 算法代码&#xff1a; #include<bits/stdc.h> using namespace std;int main() {int N;cin >> N; // 读取数据行数unordered_map<int, int> idCount; // 用于统计每个ID出现的次数vector<int> ids; …...

【数据结构与算法】Java描述:第二节:LinkedList 链表

一、链表的概念与结构 1.1 概念&#xff1a; 通俗的来说&#xff0c;链表是由一个个结点连接起来的就叫链表。 1.2 结构&#xff1a; 链表存储的数据 在 物理上是不一定连续的&#xff0c;它是由前面链接后面&#xff0c;一个个连起来的。 二、Java底层的 LinkedList 2.1…...

LLM run

lmstudio lmstudio ollama ollama N 卡使用自带UI gpu加速推理 ,选择满足条件的&#xff0c; ds模型选择列表 https://ollama.com/library/deepseek-r1 a卡当前支持的显卡型号 I卡 gpu加速配置 2025.3 intel Official project optimization https://www.modelscope.cn/m…...

k8s面试题总结(十)

1.为什么HDFS不适合存储小文件&#xff1f; 元数据存储在NameNode内存中&#xff0c;一个节点的内存是有限的。存储大量的小文件会消耗过多的寻道时间 同等大小一个大文件的访问速度一定比多个小文件访问速度快 3.NameNode存储block的数量是有限的 比如你一个block元数据需要消…...

android中activity1和activity2中接收定时消息

android中activity1和activity2中接收定时消息 业务类 import java.util.Timer; import java.util.TimerTask;public class MyAnager {private MyAnager() {}private static MyAnager instance;//回调接口onRecvTaskpublic interface OnMsgListener {void onRecvTask(String a…...

Non-Homophilic Graph Pre-Training and Prompt Learning

Non-Homophilic Graph Pre-Training and Prompt Learning KDD25 ​#paper/⭐#​ 目的&#xff1a;对异配图进行prompt ‍ ​​ 方法 邻居节点的综合嵌入 s v 1 ∣ V ( S v ) ∣ ∑ u ∈ V ( S v ) h u ⋅ s i m ( h u , h v ) , \mathbf{s}_{v}\frac{1}{|V(S_{v})|}\su…...

Ollama 框架本地部署教程:开源定制,为AI 项目打造专属解决方案!

Ollama 是一款开源的本地大语言模型&#xff08;LLM&#xff09;运行框架&#xff0c;用于管理和运行语言模型。具有以下核心特点&#xff1a; 开源可定制&#xff1a;采用 MIT 开源协议&#xff0c;开发者能自由使用、阅读源码并定制&#xff0c;可根据自身需求进行功能扩展和…...

unittest框架 核心知识的系统复习及与pytest的对比

1. unittest 介绍 是什么&#xff1a;Python 标准库自带的单元测试框架&#xff0c;遵循 xUnit 架构&#xff08;类似Java的JUnit&#xff09;。 核心概念&#xff1a; TestCase&#xff1a;测试用例的基类&#xff0c;所有测试类需继承它。 TestSuite&#xff1a;测试套件&a…...

vue面试宝典之二

39.vue2和vue3中源码是如何解析模版的 new vue&#xff08;&#xff09;的时候实例化了类之后根据传进去的option进行模版的类型div还是text还是啥进行匹配&#xff0c;同时拿到节点的值进行绑定&#xff0c;比如正则匹配{{}}将匹配到的变量拿去跟option中的data查找到具体的值…...

ESLint 深度解析:原理、规则与插件开发实践

在前端开发的复杂生态中&#xff0c;保障代码质量与规范性是构建稳健、可维护项目的基石。ESLint 作为一款强大的代码检查工具&#xff0c;其默认规则与插件能满足多数常见需求&#xff0c;但面对特定团队规范或项目独特要求&#xff0c;自定义 ESLint 插件便成为有力的扩展手段…...

洛谷P1091

题目如下 思路 谢谢观看...

随机树算法 自动驾驶汽车的路径规划 静态障碍物(Matlab)

随着自动驾驶技术的蓬勃发展&#xff0c;安全、高效的路径规划成为核心挑战之一。快速探索随机树&#xff08;RRT&#xff09;算法作为一种强大的路径搜索策略&#xff0c;为自动驾驶汽车在复杂环境下绕过静态障碍物规划合理路径提供了有效解决方案。 RRT 算法基于随机采样思想…...

江科大51单片机笔记【9】DS1302时钟可调时钟(下)

在写代码前&#xff0c;记得把上一节的跳线帽给插回去&#xff0c;不然LCD无法显示 一.DS1302时钟 1.编写DS1302.c文件 &#xff08;1&#xff09;重新对端口定义名字 sbit DS1302_SCLKP3^6; sbit DS1302_IOP3^4; sbit DS1302_CEP3^5;&#xff08;2&#xff09;初始化 因为…...

ssm_mysql_暖心家装平台

收藏关注不迷路&#xff01;&#xff01; &#x1f31f;文末获取源码数据库&#x1f31f; 感兴趣的可以先收藏起来&#xff0c;还有大家在毕设选题&#xff08;免费咨询指导选题&#xff09;&#xff0c;项目以及论文编写等相关问题都可以给我留言咨询&#xff0c;希望帮助更多…...

一周学会Flask3 Python Web开发-SQLAlchemy简介及安装

锋哥原创的Flask3 Python Web开发 Flask3视频教程&#xff1a; 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili SQLAlchemy是Python编程语言下的一款开源软件。提供了SQL工具包及对象关系映射&#xff08;ORM&#xff09;工具&#xff0c;…...

< 自用文儿 > DELETED 设置速读 in Ubuntu24

systemctl 和 DELETED&#xff1a; 配置文件&#xff1a; vi /etc/systemd/system/ DELETED.service [Unit] DescriptionV2Ray Service Documentation DELETED Afternetwork.target nss-lookup.target[Service] #Usernobody CapabilityBoundingSetCAP_NET_ADMIN CAP_NET_BIN…...

自动化同步多服务器数据库表结构

当项目每次进行版本升级的时候&#xff0c;如果在这次迭代中涉及表结构变更&#xff0c;需要将不同的生产环境下&#xff0c;都需要同步表结构的DDL语句&#xff0c;比较麻烦&#xff0c;而且还有可能忘记同步脚本&#xff0c;导致生产环境报错.... 该方案采用SpringBootMybat…...

深入理解 HTML 元素:构建网页的基础

在网页开发的领域中&#xff0c;HTML&#xff08;超文本标记语言&#xff09;犹如一座大厦的基石&#xff0c;支撑起整个网页的结构与内容呈现。而 HTML 元素&#xff0c;则是构成这座基石的基本单位。今天&#xff0c;就让我们一同深入探索 HTML 元素的奥秘。 HTML 元素的构成…...

MusePublic Art Studio参数详解:随机种子锁定与艺术风格复现方法

MusePublic Art Studio参数详解&#xff1a;随机种子锁定与艺术风格复现方法 1. 理解随机种子&#xff1a;艺术创作的"基因密码" 在AI图像生成领域&#xff0c;随机种子就像是每幅作品的DNA序列。它决定了生成过程中的随机性因素&#xff0c;是控制输出结果一致性的…...

【稀缺预警】Python 3.14 JIT编译器深度剖析:3类隐性CPU浪费模式+2套自动降本脚本(附真实AWS账单对比图)

第一章&#xff1a;Python 3.14 JIT编译器的演进逻辑与成本敏感性定位Python 3.14 并非官方发布的正式版本&#xff08;截至2024年&#xff0c;CPython最新稳定版为3.12&#xff0c;3.13处于预发布阶段&#xff09;&#xff0c;但本章以假设性技术前瞻视角&#xff0c;探讨若Py…...

手把手教你用FreeRTOS创建第一个任务:从栈初始化到SVC调用的完整流程

深入解析FreeRTOS任务启动机制&#xff1a;从栈初始化到任务切换的实战指南 在嵌入式开发领域&#xff0c;实时操作系统(RTOS)已成为复杂项目的标配工具。作为开源RTOS中的佼佼者&#xff0c;FreeRTOS凭借其轻量级、可移植性强等特点&#xff0c;在STM32等Cortex-M系列MCU上广…...

tao-8k在AI应用开发中的价值:为LangChain+LlamaIndex提供高质量向量底座

tao-8k在AI应用开发中的价值&#xff1a;为LangChainLlamaIndex提供高质量向量底座 1. 为什么需要高质量的文本嵌入模型 在构建AI应用时&#xff0c;我们经常需要将文本转换为计算机能够理解的数值表示&#xff0c;这就是文本嵌入&#xff08;embedding&#xff09;的核心任务…...

Youtu-Parsing镜像免配置:预置outputs目录权限+日志轮转自动配置

Youtu-Parsing镜像免配置&#xff1a;预置outputs目录权限日志轮转自动配置 1. 引言&#xff1a;告别繁琐配置&#xff0c;专注文档解析 如果你用过一些AI模型&#xff0c;肯定遇到过这样的麻烦&#xff1a;好不容易把服务跑起来了&#xff0c;结果发现生成的图片没地方保存&…...

【2024最硬核数据工程升级】:Polars 2.0清洗架构重构——支持10亿行/分钟实时清洗的4层缓冲设计

第一章&#xff1a;Polars 2.0大规模数据清洗技巧如何实现快速接入Polars 2.0 基于 Rust 构建&#xff0c;原生支持并行执行与零拷贝内存访问&#xff0c;在处理 TB 级结构化数据时展现出远超 Pandas 的吞吐能力。其 LazyFrame 模式可将整个清洗流程编译为优化的执行计划&#…...

从规格书到点亮屏幕:RK3568+GM8775C双通道LVDS调试全流程解析

RK3568GM8775C双通道LVDS屏幕调试实战&#xff1a;从参数解析到设备树配置 第一次拿到一块非标准LVDS屏幕时&#xff0c;我盯着规格书里密密麻麻的表格和数据完全无从下手。作为硬件工程师&#xff0c;我们常常需要面对各种定制化显示屏的驱动问题。本文将带你深入理解如何从屏…...

AI智能二维码工坊后端对接:REST API接入业务系统指南

AI智能二维码工坊后端对接&#xff1a;REST API接入业务系统指南 1. 为什么需要后端对接&#xff1f;——从界面操作到系统集成的跨越 你可能已经试过在AI智能二维码工坊的WebUI里点点鼠标&#xff1a;输入一段文字&#xff0c;几毫秒就生成一张高清二维码&#xff1b;上传一…...

LiuJuan Z-Image效果对比展示:BF16 vs FP16在人像细节与稳定性上的差异

1. 1. 1. 1. 1. 1. 1. 1. 1. 概述 1. 1. 1. 概述 1. 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 1. 概述 1. 概述 1. 概述 1. 概述 1. 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1. 概述 1…...

SenseVoiceSmall实战案例:如何用AI分析会议录音中的情绪变化

SenseVoiceSmall实战案例&#xff1a;如何用AI分析会议录音中的情绪变化 1. 会议录音分析的痛点与解决方案 在日常工作中&#xff0c;会议录音分析一直是个耗时费力的任务。传统方法需要人工反复听取录音&#xff0c;不仅效率低下&#xff0c;还容易遗漏关键信息。特别是会议…...