当前位置: 首页 > article >正文

InfluxDB(一)——一个高效处理数据的时序数据库

目录一、什么是时序数据库InfluxDB关系型数据库行式存储是怎么存的时序数据库列式存储是怎么存的二、InfluxDB的特点1. 极致的写入性能2. 高效的存储压缩3. 独特的数据模型4. 强大的查询与分析能力5. 自动化的数据生命周期管理6. 版本特性7. 业务场景选型总结为什么选择 InfluxDB三、安装InfluxDB1. 拉取InfluxDB 2.x 镜像2. 创建数据持久化目录3. 启动InfluxDB4. 验证InfluxDB运行状态5. 访问InfluxDB Web UI四、总结一、什么是时序数据库InfluxDB先了解一个概念“时序”顾名思义就是按照时间序列排序的数据InfluxDB就是专门为高效存储、查询和分析这类带时间戳的海量数据而设计的时序数据库Time-Series Database这种数据在物联网、监控系统、金融分析等领域非常常见。生活中随处可见“按时间记录”的数据手机每小时的电量变化空调的实时温度小区充电桩的充电时长服务器的运行状态……这些按照时间顺序排列持续产生的数据被称为“时序数据”。随着数据越来越多面对海量时序数据时普通关系型数据库MySQL处理起来会显得力不从心甚至成为系统瓶颈。存在几个天然劣势写入性能不足当时序数据以每秒成千上万条的速度涌入设备运行数据高频上报MySQL的索引维护和事务锁机制导入写入速度急剧下降存储效率低为了支持灵活查询关系数据库的行存储结构在处理大量重复的时间戳和标签时占用空间远大于转为时序优化的列式存储这句话可能不好理解使用一个例子空调的温湿度传感器sensor_01每隔 1s上报一次数据。数据库字段有时间戳、设备SN(sensor_01)、温度值连续 5 秒的数据2026-03-25 10:00:01, sensor_01, 25.1 2026-03-25 10:00:02, sensor_01, 25.2 2026-03-25 10:00:03, sensor_01, 25.1 2026-03-25 10:00:04, sensor_01, 25.3 2026-03-25 10:00:05, sensor_01, 25.2 ……关系型数据库行式存储是怎么存的原理它把每一行数据当作一个完整的整体对象存进去。就像把每份文件单独装进一个信封。第1行[2026-03-25 10:00:01,sensor_01,25.1] - 存入磁盘第2行[2026-03-25 10:00:02,sensor_01,25.2] - 存入磁盘第3行[2026-03-25 10:00:03,sensor_01,25.1] - 存入磁盘...以此类推问题所在为什么效率低你会发现sensor_01这个标签在每一行里都重复存储了一遍。如果有 100 万个数据点sensor_01这个字符串就在磁盘上重复写了 100 万次时间戳虽然每秒在变但前缀年月日时也是大量重复的。结果大量的磁盘空间被用来存储重复的元数据标签和时间前缀而不是有价值的数值。这就像写文章时每一句话前面都强行加一遍作者的名字非常浪费纸张时序数据库列式存储是怎么存的原理它不按“行”存而是按“列”存。它把相同类型的数据放在一起。就像把图书馆的书按“作者”、“出版年份”、“书名”分开放在不同的架子上。它会这样处理上面的数据时间戳列(time)专门存时间。[01, 02, 03, 04, 05](它甚至只存差值比如 1, 1, 1极度压缩)标签列(Tag)专门存设备SN。[sensor_01, sensor_01, sensor_01, sensor_01, sensor_01]关键点因为这一列全是sensor_01压缩算法如游程编码 RLE会发现“哦连续 5 个都是同一个词”于是它只存一次sensor_01加上一个计数5。存储结果实际上只占用了极小的空间。数值列(Field)专门存温度。[25.1, 25.2, 25.1, 25.3, 25.2](使用专门针对浮点数的压缩算法如 Gorilla 编码利用相邻数值的相似性进行压缩)优势所在去重重复的标签只存一次或存一次计数。压缩连续的时间戳和相似的数值可以被压缩到极小通常能压缩到原始大小的 1/10 甚至 1/20。时间聚合查询慢当需要查询“过去一个月的平均问题”或“最近一小时的流量峰值”时MySQL需要扫描大量行并进行实时计算响应延迟高而InfluxDB内置了针对时间串口的预计算和压缩算法能毫秒级返回结果缺乏生命周期管理时序数据往往“越久越不值钱”需要自动过期删除。在MySQL中这需要编写复杂的定时任务而InfluxDB中只需要一个简单的保留策略Retention Policy即可自动完成从上就可以简单的了解时序数据库InfluxDBInfluxDB是一种开源的时序数据库由InfluxData公司开发。它专为高性能地存储、查询和分析时间序列数据而优化支持高写入和查询负载适用于实时监控、指标收集等场景。小记有人可能会联想MongoDB这种文档数据库曾经也使用过将物联网数据存储到MongoDB中可以先参考一下这篇时序数据库一哥 InfluxDB 的公司 InfluxData曾在 2018 年发表了一篇关于 InfluxDB vs MongoDB 的博客。文中使用 InfluxDB v1.7.2 和 MongoDB v4.0.4 做对比得出 InfluxDB 比 MongoDB 快 2.4 倍的结论。当然可信度有待考量先不赘述后面再详解MongoDB和时序数据库的区别可以自行了解二、InfluxDB的特点其核心特点可以概括为“高写入、高压缩、快查询、易管理”。以下是其详细的技术特点1. 极致的写入性能追加写模型(Append-Only)针对时序数据“只增不改”的特性InfluxDB 采用日志结构合并树LSM-Tree的变体数据直接顺序写入磁盘避免了传统关系型数据库的行锁竞争和随机 I/O 开销。高并发支持能够轻松应对每秒数百万甚至上千万个数据点的写入压力非常适合物联网传感器、服务器监控日志等高频数据流场景。2. 高效的存储压缩列式存储数据按列时间戳、标签、字段分别存储而非按行存储。这使得相同类型的数据如连续的温度值聚集在一起极大地提高了压缩效率。专用压缩算法时间戳使用差分编码只存时间差因为时间通常是均匀递增的。标签(Tags)使用游程编码因为元数据如设备ID在一段时间内是高度重复的。数值(Fields)使用Gorilla 压缩等算法处理浮点数。效果通常能将原始数据压缩至1/10 甚至 1/20的大小显著降低存储成本。3.独特的数据模型InfluxDB 将数据分为四类这种设计是其高性能的关键Measurement(测量)类似关系数据库中的“表”表示数据的类别如air_tem。Tag(标签)被索引的元数据如device_snsensor_01。Tag 用于快速过滤和分组查询是查询速度的核心。Field(字段)未被索引的实际数值如tempature0.25.1。Field 存储具体测量值支持各种聚合计算。Timestamp(时间戳)每条记录的主键精确到纳秒。先大概了解一下后续会仔细讲述InfluxDB 的数据模型概念和 RDBMS 稍有不同下面是和 MySQL 的概念对照表InfluxDBMySQL解释BucketsDatabase数据桶-数据库即存储数据的命名空间。MeasurementTable度量-表。PointRecord数据点-记录。FieldField未设置索引的字段。TagIndex设置了索引的字段。4. 强大的查询与分析能力双语言支持InfluxQL类 SQL 语法简单易学适合常规的时间范围查询和聚合。Flux一种功能更强大的函数式脚本语言类似 Python/Pandas支持复杂的数据转换、多源连接Join、自定义逻辑和跨时间窗口分析。内置时间函数原生支持降采样、插值、移动平均、异常检测等时间序列专用操作无需在应用层编写复杂代码。5. 自动化的数据生命周期管理保留策略可配置数据自动过期时间例如“只保留最近 7 天的原始数据”系统后台自动清理防止磁盘爆满。连续查询支持后台自动执行预定义的聚合任务将高频原始数据实时计算并存储为低频汇总数据如“每分钟平均值”实现冷热数据分层存储兼顾细节与历史趋势6. 版本特性先了解一下InfluxDB的版本有1.x、2.x和3.x特性维度InfluxDB 1.xInfluxDB 2.xInfluxDB 3.x (Core/Cloud)发布时间2016 - 2020 (主流)2020 - 2024 (主流)2024 - 至今 (最新)开发语言GoGoRust核心架构单体架构行式存储单体架构 (集成UI/API/Engine)行式存储云原生架构列式存储存算分离存储引擎TSM (Time Structured Merge Tree)TSM / TSMBApache Arrow (内存), Parquet (磁盘/对象存储)查询引擎自研引擎自研引擎Apache DataFusion (向量化执行)主要查询语言InfluxQL (类SQL)Flux (函数式脚本复杂但灵活)SQL (标准ANSI SQL), InfluxQL (兼容),不支持 Flux数据模型Measurement, Tag, Field, TimeBucket, Measurement, Tag, Field, TimeTable, Column (强类型), Time基数限制有 (高基数易导致 OOM)有 (虽优化但仍受限于内存)无限制 (支持无限基数/高势数据)存储后端本地磁盘本地磁盘本地磁盘 或 对象存储 (S3, GCS, Azure Blob)用户界面 (UI)简单需配合 Grafana内置强大 UI (可视化/告警/任务)简化 UI (侧重管理)推荐对接外部 BI/Grafana部署模式二进制/Docker (开源版无集群)二进制/Docker (开源版无集群企业版有集群)单节点高性能 (Core), 分布式集群 (Cloud/Enterprise)扩展性弱 (主要靠垂直扩展)中 (垂直扩展为主)极强 (水平扩展PB级数据支持)生态集成Grafana (黄金搭档)内置可视化支持 Grafana完美支持 SQL 工具 (DBeaver, Tableau等), Grafana适用场景传统监控、中小规模时序数据全栈监控、需要内置可视化的场景大规模物联网、金融分析、PB级日志、云原生环境当前状态维护模式 (不再新增功能)成熟稳定 (主流使用版本)快速迭代 (未来方向Core版免费开源)可以了解到常规监控、IoT 等中小规模场景优先选择稳定成熟、生态完善的 2.x 开源版新项目、海量时序数据、高基数设备、需要标准 SQL 或低成本对象存储的云原生场景直接选用架构更先进、性能与成本优势更明显的3.x 系列7. 业务场景选型可以根据业务场景选择关系数据库MySQL或时序数据库InfluxDB等等场景类型推荐方案原因物联网设备数据上报智能家居、工业传感器InfluxDB海量时序点、超高写入吞吐、自动过期策略、高压缩比、按时间聚合极快应用 / 服务器监控CPU、内存、接口耗时、QPSInfluxDB Grafana天然时序模型支持降采样 / 连续查询与可视化生态无缝对接日志时序检索、链路追踪指标InfluxDB写入量大、按时间筛选为主、标签索引高效不适合全文检索金融行情数据股票、币价、K 线InfluxDB 3.x/ 专业时序库高基数、高并发、列式存储支持类 SQL 查询适合时序行情金融交易流水、账户余额、核心账务MySQL / PostgreSQL必须强事务 ACID、对账精确、可回滚、多表关联、数据一致性优先用户订单、支付、商品、会员、权限MySQL / PostgreSQL业务关系复杂需要事务、联表查询、复杂条件更新配置信息、字典表、元数据MySQL数据量小、结构固定、随机查询 / 修改频繁后台管理系统、ERP、CRM、CMSMySQL通用关系型业务生态完善开发与运维成本低临时测试、小规模数据、个人项目两者皆可数据量小性能差异不明显按团队技术栈选择总结为什么选择 InfluxDB场景需求传统关系型数据库 (MySQL)InfluxDB写入速度慢受限于索引更新和事务极快顺序写无事务锁存储空间大行存冗余多极小列存高压缩时间查询需建立复杂索引慢原生支持毫秒级响应数据管理需手动删除旧数据自动过期自动降采样一句话总结InfluxDB 是通过牺牲通用事务能力不支持复杂 Join 和强事务换取了时序数据领域极致的写入性能、存储效率和查询速度三、安装InfluxDBinfluxDB支持MacOS、Windows、Linux、Docker等下载安装此处使用Docker安装可以在DcokerHub上查询核实的版本此处使用InfluxDB 2.x因为本人从事物联网行业当选文章选择InfluxDB 2.x可以根据上述自行选择Influx版本官方文档 https://docs.influxdata.com/influxdb/v2.7/建议获取2.0版本以上的自带监控UI1. 拉取InfluxDB 2.x 镜像推荐拉取稳定版如 2.7.x也可使用latest获取最新版# 拉取指定稳定版 docker pull influxdb:2.7.5 # 或拉取最新版 # docker pull influxdb:latest2. 创建数据持久化目录启动时自动创建管理员账号、组织、数据桶、Token无需手动初始化单机部署时需要挂载到本地文件夹下将数据持久化到宿主机删除容器不丢数据先在 Mac 本地创建数据 / 配置目录避免权限问题mkdir -p ~/dev/influxdb2/data mkdir -p ~/dev/influxdb2/config3. 启动InfluxDB可自行替换自定义参数用户名、密码、组织、桶名相当于Mysql的数据库名docker run -d \ --name influxdb2 \ --restart always \ -p 8086:8086 \ -v ~/dev/influxdb2/data:/var/lib/influxdb2 \ -v ~/dev/influxdb2/config:/etc/influxdb2 \ -e DOCKER_INFLUXDB_INIT_MODEsetup \ -e DOCKER_INFLUXDB_INIT_USERNAMEadmin \ -e DOCKER_INFLUXDB_INIT_PASSWORDAdmin123456 \ -e DOCKER_INFLUXDB_INIT_ORGechola-org \ -e DOCKER_INFLUXDB_INIT_BUCKETechola-bucket \ -e DOCKER_INFLUXDB_INIT_RETENTION30d \ influxdb:2.7.5 #简写一行 # docker run -d --name influxdb2 --restart always -p 8086:8086 -v ~/dev/influxdb2/data:/var/lib/influxdb2 -v ~/dev/influxdb2/config:/etc/influxdb2 -e DOCKER_INFLUXDB_INIT_MODEsetup -e DOCKER_INFLUXDB_INIT_USERNAMEadmin -e DOCKER_INFLUXDB_INIT_PASSWORDAdmin123456 -e DOCKER_INFLUXDB_INIT_ORGechola-org -e DOCKER_INFLUXDB_INIT_BUCKETechola-bucket -e DOCKER_INFLUXDB_INIT_RETENTION30d influxdb:2.7.5参数说明--restart alwaysDocker 重启时自动启动容器。-p8086:8086映射宿主机 8086 端口InfluxDB 默认端口InfluxData。-v挂载宿主机目录到容器实现数据持久化。DOCKER_INFLUXDB_INIT_RETENTION30d数据保留 30 天可自定义如1w1 周、0永久海量测试数据不建议长期保留4. 验证InfluxDB运行状态# 查看运行中的容器 docker ps # 查看容器日志排查问题 docker logs influxdb2容器管理# 停止容器 docker stop influxdb2 # 启动容器 docker start influxdb2 # 重启容器 docker restart influxdb2 # 删除容器先停止 docker rm influxdb25. 访问InfluxDB Web UI打开浏览器访问http://localhost:8086使用刚才配置的账号密码访问InfluxDB进入之后就是当前界面可以进行数据导入四、总结通过以上对 InfluxDB 从概念、特点到安装实践的逐步剖析可以清晰地看到时序数据库并非要取代传统关系型数据库而是为了解决特定领域时序数据的痛点而生。InfluxDB 的核心价值一句话总结InfluxDB 通过“列式存储 专用压缩 追加写模型 标签索引”四大支柱在时序数据领域实现了写入快 10 倍、存储省 90%、查询响应从秒级降至毫秒级。

相关文章:

InfluxDB(一)——一个高效处理数据的时序数据库

目录 一、什么是时序数据库InfluxDB? 关系型数据库(行式存储)是怎么存的? 时序数据库(列式存储)是怎么存的? 二、InfluxDB的特点 1. 极致的写入性能 2. 高效的存储压缩 3. 独特的数据模型…...

DeepSeek LintCode 3706 · 满足条件的数对的数量 public long countValidPairs(int[] nums1, int[] nums2, int dif

这个问题是 LintCode 3706 “满足条件的数对的数量”&#xff0c;要求统计满足 nums1[i] - nums1[j] < nums2[i] - nums2[j] diff&#xff08;其中 i < j&#xff09;的数对 (i, j) 的数量。 问题理解 给定两个数组 nums1 和 nums2&#xff0c;以及一个整数 diff&#…...

光伏混合储能直流微电网simulink模型 1.直流微电网由锂电池,超级电容,光伏和直流负载组成 2

光伏混合储能直流微电网simulink模型 1.直流微电网由锂电池&#xff0c;超级电容&#xff0c;光伏和直流负载组成 2.光伏采用电导增量法实现最大功率输出 3.锂电池和超级电容采用直流母线电压控制策略&#xff0c;根据直流母线电压高低实现充放电 实现以下目标&#xff1a; 1.光…...

OpenClaw省钱全攻略,掌握这5招,每月少花几百块冤枉钱

手把手教你一键部署OpenClaw&#xff0c;连接微信、QQ、飞书、钉钉等&#xff0c;1分钟全搞定&#xff01; 刚把OpenClaw折腾好&#xff0c;你可能正沉浸在AI秒回代码、自动理任务的神奇体验里&#xff0c;心里直呼过瘾。可还没等新鲜劲过去&#xff0c;一翻后台账单&#xff…...

别只盯着 Claw 了,这波“真香”技能才是真的生产力神器!

手把手教你一键部署OpenClaw&#xff0c;连接微信、QQ、飞书、钉钉等&#xff0c;1分钟全搞定&#xff01; 说白了&#xff0c;各家大厂出的 Claw 产品&#xff0c;核心逻辑就是“AI 大模型 技能插件”。模型是地基&#xff0c;而你用得爽不爽&#xff0c;全看这些技能给不给…...

深夜调车的时候突然发现,Apollo的泊车轨迹优化藏着不少“骚操作“。咱们今天不聊虚的,直接扒开代码看三个核心模块怎么打架...哦不,怎么配合的

apollo 泊车轨迹优化代码 hybridastariaps平滑优化obca平滑优化 第一个图是matlab绘制 后面的图是程序用sdl库绘制先看Hybrid A*这个愣头青。这货生成的轨迹就像刚拿驾照的新手&#xff0c;能避开障碍物但轨迹拧巴得很。看看它扩展节点的代码片段&#xff1a; Node3D* expand(…...

Ruby开发工具JetBrains RubyMine

链接&#xff1a;https://pan.quark.cn/s/6d78ff88b12eJetBrains RubyMine是一个全新的为Ruby 和 Rails开发者准备的代码编辑器 &#xff0c;对于Ruby这种比较新兴的编程语言&#xff0c;如果你是Ruby的爱好者&#xff0c;不妨试试使用它作为你的开发工具。软件是建立在IntellJ…...

Python面向对象:封装、继承、多态

作为Python面向对象编程&#xff08;OOP&#xff09;的三大核心特性&#xff0c;封装、继承、多态是从编程新手进阶到熟练开发者的必备知识。它们不是晦涩的理论&#xff0c;而是能让代码更简洁、复用性更强、扩展性更好的实用工具。 一、什么是面向对象&#xff1f; 在讲三大特…...

COMSOL锂枝晶生长仿真模拟:四场耦合(化学场、浓度场、电场、应力场)

comsol锂枝晶生长仿真模拟-应力耦合。 化学场、浓度场、电场、应力场&#xff0c;四场耦合模拟锂枝晶的生长。锂金属负极在固态电池中总爱搞事情&#xff0c;枝晶刺穿隔膜的戏码天天上演。实验室里做破坏性测试成本太高&#xff0c;数值仿真就成了预判枝晶生长路径的透视眼。CO…...

SecGPT-14B+OpenClaw联调指南:解决模型响应超时问题

SecGPT-14BOpenClaw联调指南&#xff1a;解决模型响应超时问题 1. 问题背景与场景定位 上周在尝试用OpenClaw调用SecGPT-14B分析一份12万字的网络安全报告时&#xff0c;遭遇了令人头疼的响应超时问题。这个场景很典型——当我们需要处理长文本安全分析时&#xff0c;模型推理…...

【Pygame】第15章 游戏人工智能基础、行为控制与寻路算法实现

摘要 人工智能是游戏开发中的重要组成部分&#xff0c;它能够赋予非玩家角色更自然的行为表现&#xff0c;使游戏世界显得更加真实、生动&#xff0c;并且具有挑战性。 在 2D 游戏中&#xff0c;AI 通常并不追求真正意义上的“智能”&#xff0c;而是通过一系列规则、状态和算…...

智力能效:Token之上的竞争

AI软件竞争的本质是智力能效的竞争。 编者按 2025 年初, Anthropic 宣布 Claude API的价格比GPT-4高出50%。原本以为会出现的大量客户流失却在六个月后呈现出截然相反的走向&#xff1a;Claude在企业市场的采用率不仅没有下降&#xff0c;反而上升了。 过去两年&#xff0c;无数…...

【网络安全干货】黑客内网渗透零基础入门,超详细基础知识手把手教学

0x01 内网概述 内网也指局域网&#xff08;Local Area Network&#xff0c;LAN&#xff09;是指在某一区域内由多台计算机互联成的计算机组。一般是方圆几千米以内。局域网可以实现文件管理、应用软件共享、打印机共享、工作组内的历程安排、电子邮件和传真通信服务等功能。 内…...

从 AI 助手到 ADT 自动化桥梁:全面解析 Vibing Steampunk 的定位、能力边界与典型使用场合

Vibing Steampunk 这个 GitHub Repository,如果只看名字,很容易让人误以为它只是一个面向 Steampunk,也就是 SAP BTP ABAP environment 的小工具。可一旦把 README、架构文档、CLI 指南和相关实现说明读完,你会发现它的真实定位要大得多:它并不是一个普通的 ABAP 示例项目…...

内网渗透零基础入门教程!小白也能轻松搞懂内网渗透基础知识点

内网渗透初探 | 小白简单学习内网渗透 0x01 基础知识 内网渗透&#xff0c;从字面上理解便是对目标服务器所在内网进行渗透并最终获取域控权限的一种渗透。内网渗透的前提需要获取一个Webshell&#xff0c;可以是低权限的Webshell&#xff0c;因为可以通过提权获取高权限。 …...

OpenClaw邮件处理助手:Qwen3-14b_int4_awq分类与自动回复

OpenClaw邮件处理助手&#xff1a;Qwen3-14b_int4_awq分类与自动回复 1. 为什么需要邮件自动化助手 每天早晨打开邮箱&#xff0c;看到堆积如山的未读邮件总是让人头疼。订阅的新闻简报、工作沟通、广告推广混杂在一起&#xff0c;手动分类和回复消耗了大量时间。作为技术从业…...

LN2266 超小型 低电压启动 PWM 控制 升压 DC/DC 电压调整器

■ 产品概述 LN2266 是一款微型、高效率、升压 DC/DC 调整器。电路由电流模 PWM 控制环路&#xff0c;误差放大器&#xff0c;斜波产生电路&#xff0c;比较器和一个功率开关等模块组成。该芯片可在较宽负载范围内高效稳定的工作。低于 1V 的启动电压&#xff0c;可以使用 1-4节…...

PregelProtocol——定义了“LangChain执行体“最小功能集

1. 配置绑定通过前面的内容我们会发现RunnableConfig这个对象几乎时无所不在&#xff0c;我们在调用Pregel对象的时候可以将它作为参数&#xff0c;用来提供用于控制其执行行为&#xff08;比如迭代限制&#xff0c;并发控制等&#xff09;的配置。执行引擎还将它作为容器用来下…...

线程池项目(1)

推荐去看施磊老师的课程 需要课程或者代码的可以评论,看到会回复的,免费的并发与并行定义并发&#xff1a;多个线程在单核上轮流占用 CPU 时间片&#xff0c;物理上串行执行&#xff0c;但由于时间片较短&#xff0c;看起来像是同时执行。并行&#xff1a;多个线程在多核或多 C…...

Klipper固件全攻略:从配置到优化解决3D打印核心难题

Klipper固件全攻略&#xff1a;从配置到优化解决3D打印核心难题 【免费下载链接】klipper Klipper is a 3d-printer firmware 项目地址: https://gitcode.com/GitHub_Trending/kl/klipper 3D打印技术面临精度不足、振动干扰和配置复杂等挑战&#xff0c;Klipper固件通过…...

YOLOv8n-face人脸检测架构:6MB模型实现92%精度与25ms延迟的企业级方案

YOLOv8n-face人脸检测架构&#xff1a;6MB模型实现92%精度与25ms延迟的企业级方案 【免费下载链接】yolov8-face yolov8 face detection with landmark 项目地址: https://gitcode.com/gh_mirrors/yo/yolov8-face YOLOv8n-face是基于YOLOv8架构优化的轻量级人脸检测模型…...

【第五周】关键词解释:稀疏自编码器(Sparse Autoencoder,简称 SAE)

&#x1f9e0; 当我们在谈论"理解"大模型时&#xff0c;我们在谈论什么&#xff1f;今天我们要聊的关键词&#xff0c;可能是2024-2025年大模型可解释性领域最炙手可热的技术之一&#xff1a;稀疏自编码器&#xff08;Sparse Autoencoder&#xff0c;简称 SAE&#x…...

ASTM D4169针刺棉手袋的产品有效期验证方案

针刺棉手袋的产品有效期验证&#xff0c;核心是确定产品在正常使用条件下的使用寿命&#xff08;通常以使用次数或年限表示&#xff09;&#xff0c;而不仅仅是物理保质期。 结合你之前关注医疗器械运输验证的背景&#xff0c;这里需强调&#xff1a;针刺棉手袋的“有效期”验…...

JDK-02 | 我为什么越来越喜欢用 Java 的 Text Blocks

这是专栏第 2 篇。 如果第一篇 record 是在“模型表达”上让我轻松,Text Blocks 则是在“日常编码和代码审查”上让我明显省力。 我先给结论:Text Blocks 不只是少写几个 +,它真正解决的是多行文本在代码中的可读性、可评审性和可回归性。 一、我为什么会认真用这个特性 …...

Linux生产环境性能优化:内存优先策略,彻底规避Swap性能损耗

Linux生产环境性能优化&#xff1a;内存优先策略&#xff0c;彻底规避Swap性能损耗 前言 作为深耕企业级运维与安全领域的从业者&#xff0c;我们在Oracle/SAP HANA数据库、VMware虚拟化、K8s云原生集群、PrometheusELK监控体系的生产运维中&#xff0c;最常遇到的性能痛点之一…...

LLM 是怎么学习的?训练过程大揭秘

系列&#xff1a;大语言模型原理科普&#xff08;5 篇&#xff09; 本篇&#xff1a;第 2 篇 难度&#xff1a;⭐⭐ 零基础 浅显技术 字数&#xff1a;约 9000 字 阅读时间&#xff1a;20 分钟&#x1f4d6; 开篇&#xff1a;LLM 不是生来就懂 想象一下&#xff0c;你刚出生的…...

手撕 Transformer (2):嵌入层和位置编码的实现上篇文章讲过,Transformer 可分为四个部分:输入、输出、编码器、解

嵌入层的作用&#xff1a;为了将文本中词汇的数字表示转换为向量表示&#xff08;语义向量&#xff09;&#xff0c;这样后续神经网络就可以对其进行计算了。 1.1 代码实现 import torchimport torch.nn as nnimport mathfrom torch.autograd import Variableclass Embeddings…...

【数字孪生实战案例】如何给电子地图标记点实现三维点位同款的视角切换效果?~山海鲸可视化

在可视化项目中&#xff0c;常规电子地图标记点仅支持基础点位标注&#xff0c;无法联动视角切换&#xff1b;本文讲解如何为地图标记点复刻三维标记的视角跳转能力&#xff0c;实现点击点位即可一键切换预设场景视角。 1.在左侧组件库添加“GIS电子地图&#xff08;基础&#…...

阿姆智创15.6寸工控一体机厂家,源头智造ODM定制方案,赋能SMT产线及设备场景

阿姆智创15.6寸工业触控工控一体机&#xff0c;以强悍硬件性能、丰富工业接口、稳定系统适配与一站式解决方案&#xff0c;深度服务SMT产线、运动控制、机器视觉等工业场景&#xff0c;为设备厂商与制造企业提供高可靠、可定制、易集成的智能控制终端&#xff0c;助力工业自动化…...

Redis专题(一)

1. 主从部署主从复制主要⽤于实现数据的冗余备份和读分担&#xff0c;并不是真正的高可用。一个主节点&#xff0c;一个或者多个从节点。同步数据的方向&#xff1a;单向 &#xff0c;只能主节点到从节点。作用&#xff1a;数据冗余&#xff1a;除了数据持久化之外的一种数据冗…...