当前位置: 首页 > news >正文

PG:ERROR: cannot freeze committed xmax

目录

  • 原因
      • **问题原因**
      • **PostgreSQL 底层逻辑**
  • 解决方案1
      • **问题分析**
      • **排查步骤**
        • **1. 检查长时间运行的事务**
        • **2. 检查未提交的事务**
        • **3. 检查 `autovacuum` 配置**
        • **4. 检查事务 ID 使用情况**
        • **5. 检查表的 `relfrozenxid`**
      • **解决方法**
        • **1. 手动运行 `VACUUM FREEZE`**
        • **2. 调整 `autovacuum` 配置**
        • **3. 检查并终止异常连接**
        • **4. 备份并重启数据库**
      • **总结**
  • 解决方案2
    • **问题描述**
    • **问题分析**
    • **解决方案**
      • **1. 手动清理问题元组**
      • **2. 调整 `autovacuum` 配置**
      • **3. 检查并修复数据损坏**
      • **4. 升级数据库**
    • **总结**
    • **专家建议**
    • **总结**

原因

问题原因

  1. 事务 ID 状态不一致

    • Xmax 标记的事务已提交,但在事务日志(CLOG)中缺少对应事务的状态记录。
    • 这种不一致可能是由于以下原因:
      • 数据损坏:某些数据页可能损坏,导致元组状态与事务日志不一致。
      • 旧版本升级问题:数据库可能从较旧版本升级到当前版本,旧版本可能存在未修复的 bug,导致数据页状态异常。
      • autovacuum 未正确清理:某些元组可能未被 autovacuum 正常清理,导致事务 ID 无法冻结。
  2. 事务日志(CLOG)的作用

    • CLOG 用于记录事务的提交状态。当 VACUUM FREEZE 尝试冻结事务 ID 时,需要验证该事务是否已提交。
    • 如果 CLOG 中缺少对应事务的状态记录,VACUUM FREEZE 无法验证事务是否实际提交,从而导致冻结过程失败。

PostgreSQL 底层逻辑

  1. 事务 ID 和冻结机制

    • PostgreSQL 使用事务 ID(xid)来标记数据修改。为了防止事务 ID 溢出,VACUUM FREEZE 会定期回收旧的事务 ID。
    • 冻结过程中,VACUUM 会检查每个元组的 Xmax(即修改该元组的事务 ID),并验证该事务是否已提交。
  2. CLOG 的作用

    • CLOG 是事务日志,用于记录事务的提交状态。每个事务在提交时,都会在 CLOG 中记录其状态。
    • VACUUM FREEZE 尝试冻结事务 ID 时,会检查 CLOG 中的记录,以确认事务是否已提交。
  3. 冻结失败的原因

    • 如果 Xmax 标记的事务已提交,但 CLOG 中缺少对应事务的状态记录,VACUUM FREEZE 无法验证事务是否实际提交,从而导致冻结失败。
    • 这种情况通常发生在以下场景:
      • 数据库从较旧版本升级,旧版本可能存在未修复的 bug。
      • 数据页损坏,导致元组状态与事务日志不一致。
      • autovacuum 未正确清理,导致事务 ID 无法冻结。

解决方案1

问题分析

  1. 错误含义

    • VACUUM FREEZE 的目的是回收旧的事务 ID(xid),以防止事务 ID 溢出。
    • 错误提示 cannot freeze committed xid xxx 表示某个事务 ID 无法被冻结,可能是因为该事务 ID 仍然被某些查询或事务引用。
  2. 可能原因

    • 长时间运行的事务:某些事务可能长时间未提交或回滚,导致其占用的事务 ID 无法被冻结。
    • 未正确关闭的连接:某些客户端连接可能未正常关闭,导致事务 ID 仍然被占用。
    • 配置问题autovacuum 配置可能不足以处理当前的工作负载。

排查步骤

1. 检查长时间运行的事务

运行以下查询,检查是否有长时间运行的事务:

SELECT pid, query_start, query, state
FROM pg_stat_activity
WHERE state = 'active' AND query IS NOT NULL;
  • 如果发现有长时间运行的事务,可以尝试终止这些事务:
    SELECT pg_terminate_backend(pid);
    
2. 检查未提交的事务

运行以下查询,检查是否有未提交的事务:

SELECT pid, query_start, query, state
FROM pg_stat_activity
WHERE state = 'idle in transaction';
  • 如果发现有未提交的事务,可以尝试终止这些事务:
    SELECT pg_terminate_backend(pid);
    
3. 检查 autovacuum 配置

autovacuum 是 PostgreSQL 的自动清理机制,负责定期运行 VACUUMANALYZE。如果配置不当,可能会导致事务 ID 冻结失败。

运行以下命令,检查 autovacuum 配置:

SHOW autovacuum;
SHOW autovacuum_freeze_max_age;
SHOW autovacuum_multixact_freeze_max_age;
  • 确保 autovacuum 是启用的,并且 autovacuum_freeze_max_ageautovacuum_multixact_freeze_max_age 的值适合您的工作负载。
4. 检查事务 ID 使用情况

运行以下查询,检查当前事务 ID 的使用情况:

SELECT pg_current_xact_id();
  • 如果事务 ID 接近 2^32 - 1(即 4294967295),需要尽快解决事务 ID 溢出问题。
5. 检查表的 relfrozenxid

运行以下查询,检查表的冻结事务 ID:

SELECT relname, relfrozenxid
FROM pg_stat_user_tables
WHERE relfrozenxid != 0;
  • 如果某些表的 relfrozenxid 过旧,可能需要手动运行 VACUUM FREEZE 或调整 autovacuum 配置。

解决方法

1. 手动运行 VACUUM FREEZE

尝试手动运行 VACUUM FREEZE,以强制回收旧的事务 ID:

VACUUM (FREEZE, ANALYZE);
  • 如果仍然报错,可以尝试分表运行:
    VACUUM (FREEZE, ANALYZE) table_name;
    
2. 调整 autovacuum 配置

根据工作负载,调整 autovacuum 配置:

ALTER SYSTEM SET autovacuum = on;
ALTER SYSTEM SET autovacuum_freeze_max_age = 100000000;
ALTER SYSTEM SET autovacuum_multixact_freeze_max_age = 100000000;
  • 重启数据库以应用更改:
    sudo systemctl restart postgresql
    
3. 检查并终止异常连接

如果发现有异常连接或长时间运行的事务,可以终止这些连接:

SELECT pg_terminate_backend(pid)
FROM pg_stat_activity
WHERE state = 'active' OR state = 'idle in transaction';
4. 备份并重启数据库

如果上述方法无效,可以考虑备份数据库并重启数据库:

pg_dumpall -U username > backup.sql
sudo systemctl restart postgresql

总结

  • 优先检查长时间运行的事务和未提交的事务
  • 调整 autovacuum 配置,确保自动清理机制正常运行。
  • 手动运行 VACUUM FREEZE,分表处理以避免冲突。
  • 备份数据库并重启,作为最后的手段。

如果问题仍然存在,可以提供更多的上下文信息(例如数据库版本、表结构、工作负载等),以便进一步分析。

解决方案2

PostgreSQL 数据库中出现的 ERROR: cannot freeze committed xmax 错误的讨论。以下是该内容的总结和分析:

问题描述

  • 错误信息ERROR: cannot freeze committed xmax 572
  • 环境:PostgreSQL 10.14,运行在 RHEL 系统上。
  • 现象:该错误发生在 autovacuum 过程中,导致 autovacuum freeze 进程失败。
  • 受影响的表pg_procpg_depend 两个系统表。
  • 查询结果
    • txid_status(572) 显示事务 ID 572 已提交。
    • pg_procpg_depend 表中,事务 ID 572 仍然存在,且某些元组的 xmax 被标记为回滚(xmax_rolled_back = t)。

问题分析

  1. 事务 ID 状态不一致
    • 事务 ID 572 在 txid_status 查询中显示为已提交,但在某些表的页面级别上,元组的 xmax 被标记为回滚。
    • 这种不一致可能是由于数据页的元组状态与事务 ID 的实际状态不匹配。
SELECT txid_status(572);
  1. 可能的原因

    • 数据损坏:某些数据页可能损坏,导致元组状态不一致。
    • 旧版本升级问题:数据库可能从较旧版本升级到 PostgreSQL 10.14,旧版本可能存在未修复的 bug,导致数据页状态异常。
    • autovacuum 未正确清理:某些元组可能未被 autovacuum 正常清理,导致事务 ID 无法冻结。
  2. 关键发现

    • 问题行在 pg_procpg_depend 表中仍然可见,且与一个自定义存储函数相关。
    • 数据库初始化时间较短(约一年),初始版本为 PostgreSQL 10.x。
    • autovacuum_freeze_max_age 设置为 200000000,但表的 relfrozenxid 年龄已超过该值。

解决方案

1. 手动清理问题元组

  • 操作步骤
    1. 备份数据库
      pg_dumpall -U username > backup.sql
      
    2. 在测试环境中验证
      • 在测试环境中执行以下命令,确保不会对数据库造成不可逆的损害。
    3. 执行删除操作
      DELETE FROM pg_proc WHERE ctid = '(75,19)';
      DELETE FROM pg_depend WHERE ctid IN ('(55,76)', '(55,77)', '(55,78)', '(55,79)', '(55,80)');
      
    4. 检查结果
      SELECT COUNT(*) FROM pg_proc WHERE ctid = '(75,19)';
      SELECT COUNT(*) FROM pg_depend WHERE ctid IN ('(55,76)', '(55,77)', '(55,78)', '(55,79)', '(55,80)');
      
  • 注意事项
    • 直接操作系统表存在风险,建议在测试环境验证后再执行。

2. 调整 autovacuum 配置

  • 操作步骤
    1. 临时调整 autovacuum 配置
      ALTER SYSTEM SET vacuum_freeze_min_age = 100000000;
      ALTER SYSTEM SET autovacuum_freeze_max_age = 200000000;
      
    2. 重启数据库以应用更改
      sudo systemctl restart postgresql
      
  • 参考:PostgreSQL的AutoVacuum原理及autovacuum不工作问题解析 [2]

3. 检查并修复数据损坏

  • 操作步骤
    1. 使用 CHECKPOINTVACUUM 检查数据一致性
      CHECKPOINT;
      VACUUM (FULL, ANALYZE);
      
    2. 如果问题仍然存在
      • 备份数据库并重新初始化。
  • 参考:PostgreSQL中VACUUM操作的优化、监控与故障排查技巧 [5]

4. 升级数据库

  • 操作步骤
    1. 备份数据库
      pg_dumpall -U username > backup.sql
      
    2. 升级数据库
      • 根据您的数据库版本,选择合适的升级路径。例如,从 PostgreSQL 10.14 升级到最新版本。
    3. 验证升级结果
      • 确保升级后数据库正常运行,并再次尝试 VACUUM FREEZE 操作。
  • 参考:PostgreSQL 官方安全漏洞列表 [6]

总结

  • 优先检查长时间运行的事务和未提交的事务
  • 调整 autovacuum 配置,确保自动清理机制正常运行。
  • 手动运行 VACUUM FREEZE,分表处理以避免冲突。
  • 备份数据库并重启,作为最后的手段。
  • 升级数据库,以避免已知的 bug。

如果问题仍然存在,可以提供更多的上下文信息(例如数据库版本、表结构、工作负载等),以便进一步分析。

专家建议

  • Álvaro Herrera(PostgreSQL 开发者)提到:
    • 这些事务 ID 可能较旧,可能与数据库初始化时的版本有关。
    • 一个可能的候选修复是 PostgreSQL 10.4 中的补丁,修复了 all-visible 标志的错误。
    • 如果问题行仍然可见,可以尝试手动删除它们,但需要谨慎操作。

总结

  • 问题原因:事务 ID 状态不一致,可能是由于数据损坏或旧版本升级问题。
  • 解决方法:手动清理问题元组、调整 autovacuum 配置、检查数据一致性或升级数据库。
  • 注意事项:直接操作系统表存在风险,建议在测试环境验证后再执行。

如果您需要进一步的帮助,可以提供更多上下文信息或尝试上述解决方案。

相关文章:

PG:ERROR: cannot freeze committed xmax

目录 原因**问题原因****PostgreSQL 底层逻辑** 解决方案1**问题分析****排查步骤****1. 检查长时间运行的事务****2. 检查未提交的事务****3. 检查 autovacuum 配置****4. 检查事务 ID 使用情况****5. 检查表的 relfrozenxid** **解决方法****1. 手动运行 VACUUM FREEZE****2.…...

《论软件的可靠性评价》审题技巧 - 系统架构设计师

论软件的可靠性评价写作框架 一、考点概述 软件可靠性评价作为软件可靠性活动的关键环节,是确保软件质量、提升用户体验的重要手段。本题主要考察以下几个方面的内容: 首先,本题要求考生理解并掌握软件可靠性评价的基本概念及其在软件开发…...

【项目设计】自主HTTP服务器

目录 项目介绍 网络协议栈介绍 协议分层 数据的封装与分用 HTTP相关知识介绍 HTTP的特点 URL格式 URI、URL、URN HTTP的协议格式 HTTP响应协议格式 HTTP的请求方法 HTTP的状态码 HTTP常见的Header CGI机制介绍 CGI机制的概念 CGI机制的实现步骤 CGI机制的意义 …...

Linux操作系统:基于Linux的个人Web服务器搭建与自动化运维实践

基于Linux的个人Web服务器搭建与自动化运维实践 摘要 在互联网的海洋中,每个人都想拥有一艘属于自己的小船——一个个人Web服务器。Linux作为开源界的“老大哥”,无疑是搭建Web服务器的最佳选择。本文通过幽默风趣的方式,详细介绍了在Linux…...

[创业之路-321]:创新开拓思维和经营管理思维的比较

目录 一、概述 1.1、定义与内涵 1、创新开拓思维: 2、经营管理思维: 1.2、特点与优势 1、创新开拓思维的特点与优势: 2、经营管理思维的特点与优势: 3、应用场景与限制 4、总结 二、创新开拓思维与经营管理思维&#xf…...

vivado修改下载器下载速率

Error Launching Program X Error while launching program: fpga configuration failed. DONE PIN is not HIGH 原因是下载器速度太快了。先从任务管理器中关闭hw_server.exe试一下,要是不行就按下面三种方法解决。 第一种方法可以不用修改下载速度,直接先从vivado中将bit流…...

运维基线方案说明

1. 总体思路 建立运维基线的核心目标是保障系统稳定性、提升安全性、及时响应异常事件并不断优化系统性能。初创公司资源有限,方案应尽可能简单、易用,同时具备一定的自动化和标准化能力。建议从以下几个层面入手: 标准化文档:制…...

pycharm中配置PyQt6详细教程

PyQt6 是 Qt 框架的 Python 绑定库,基于 Qt 6 开发,专为创建跨平台图形用户界面(GUI)应用程序设计。 本章教程,主要记录在pycharm中配置使用PyQt6的流程。 一、安装基础环境 在此之前,你需要提前安装好Python解释器,推荐使用anaconda创建虚拟环境。 conda create -n pyt…...

大湾区经济网报道:2025春运收官 全国跨区流动90亿,大湾区12亿人次

(原标题:2025年春运收官:全国跨区流动超90亿人次 大湾区贡献12亿人次) 大湾区经济网2月23日电(记者 余芳)2025年春运昨日(2月22日)正式结束,全国跨区域人员流动量达90.2…...

Docker用户的困境:免费项目的减少与成本的增加

摘要 在生产环境中,Docker用户正面临新的挑战:免费项目逐渐减少,收费服务成为主流趋势。表面上免费的选项,由于缺乏必要的支持和及时更新,反而可能导致更高的隐性成本。对于依赖Docker进行开发和部署的企业而言&#x…...

1.4 嵌入式系统的软件

嵌入式系统的开发流程中,硬件和固件设计完成后,嵌入式软件承担起实现功能、用户交互、系统集成和性能优化等任务;嵌入式系统软件分为设备驱动、操作系统和应用程序三个层面。 因此嵌入式系统软件开发工程师通常分为三类:嵌入式系统…...

PHP2(WEB)

##解题思路 打开页面什么线索都没有,目录扫描只是扫出来一个index.php,而源代码没有东西,且/robots.txt是不允许访问的 于是一番查询后发现,有个index.phps的文件路径,里头写着一段php的逻辑,对url的id参数…...

【精调】LLaMA-Factory 快速开始1: Meta-Llama-3.1-8B-Instruct

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml llamafactory-cli chat examples/inference/llama3_lora_sft.yaml llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml模型下载 git clone https://www.modelscope.cn/LLM-Research/Meta-Lla…...

一、计算机等级考试——题库

(1)选择题 (2)基本操作题 (3)上网题 (4)文字题 (5)表格题 (6)演示文稿 二、计算机等级考试——标准评分 (1)选…...

Android系统开发 给system/app传包报错

一、现象 adb 命令推送apk到system/app下提示 remote couldnt create file: Read-only file system demo /oem/appsystem app 在Android设备上,/system 分区通常是只读的(Read-only file system),这意味着普通用户或应用程序…...

libxls库的编译以及基于Visual studio的配置

最近有一个需求在windows处理xls,所以就需要libxls这个库,调查了一下,基于C的库的解析情况如下: 所以最理想的就是Libxlsd个开源的方案 基于历史整理的 libxls 在 MinGW 下的编译步骤 前提条件 系统:Windows&#…...

OpenHarmony构建系统-GN与子系统、部件、模块理论与实践

理论 OpenHarmony源码体系 OpenHarmony的源码架构基于模块化设计,为了方便系统的功能的增加和裁剪,设计了基于GN构建的模块系统。整个模块可从大到小划分为产品(product)、领域/子系统集(domain)、子系统(sub system)、部件(component)、模块/组件(modu…...

kafka+spring cloud stream 发送接收消息

方案 1&#xff1a;使用旧版 StreamListener&#xff08;适用于 Spring Cloud Stream < 2.x&#xff09; 1. 添加依赖&#xff08;pom.xml&#xff09; <!-- Spring Cloud Stream Kafka Binder --> <dependency> <groupId>org.springframework.clo…...

使用ArcGIS Pro自动矢量化水系

在地理信息系统&#xff08;GIS&#xff09;领域&#xff0c;自动矢量化是一项至关重要的技术&#xff0c;它能够将栅格图像中的要素转换为矢量数据&#xff0c;从而方便后续的分析和处理。本文将详细介绍如何使用ArcGIS Pro自动矢量化水系&#xff0c;适用于那些颜色相对统一、…...

在PyCharm中运行Jupyter Notebook的.ipynb文件及其pycharm软件的基础使用

&#xff08;注意需使用PyCharm专业版&#xff0c;学生、教师可以申请免费使用&#xff1a;https://www.jetbrains.com/shop/eform/students&#xff09; 1. pycharm2024版汉化 https://blog.csdn.net/m0_74103046/article/details/144560999 2. pycharm中的python控制台和J…...

告别Qt Creator!在VSCode里用CMake+MinGW搞定Qt 5.9.9开发(附详细环境变量配置)

在VSCode中构建Qt开发环境&#xff1a;CMake与MinGW的完美组合 Qt作为跨平台应用开发框架&#xff0c;长期以来与Qt Creator深度绑定。但近年来&#xff0c;随着VSCode生态的完善&#xff0c;越来越多的开发者希望摆脱这种强依赖关系。本文将带你从零开始&#xff0c;在VSCode中…...

NHSE:重新定义你的动物森友会岛屿体验

NHSE&#xff1a;重新定义你的动物森友会岛屿体验 【免费下载链接】NHSE Animal Crossing: New Horizons save editor 项目地址: https://gitcode.com/gh_mirrors/nh/NHSE 你是否曾想过&#xff0c;如果能够自由掌控岛屿的每一个细节&#xff0c;你的动物森友会生活会是…...

告别命令行恐惧:在Ubuntu 22.10上用VS Code 1.75优雅地配置ns-3.37开发环境

告别命令行恐惧&#xff1a;在Ubuntu 22.10上用VS Code 1.75优雅地配置ns-3.37开发环境 第一次打开Ubuntu终端时&#xff0c;黑色窗口里闪烁的光标就像一道无法逾越的鸿沟。特别是当需要配置ns-3这类复杂网络模拟环境时&#xff0c;命令行操作往往让初学者望而生畏。但现代开发…...

IDE Eval Resetter:无限续杯你的JetBrains IDE试用期,告别30天限制!

IDE Eval Resetter&#xff1a;无限续杯你的JetBrains IDE试用期&#xff0c;告别30天限制&#xff01; 【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 还在为IntelliJ IDEA、PyCharm、WebStorm等JetBrains IDE的…...

如何用Universal-x86-Tuning-Utility释放电脑隐藏性能:完整使用指南

如何用Universal-x86-Tuning-Utility释放电脑隐藏性能&#xff1a;完整使用指南 【免费下载链接】Universal-x86-Tuning-Utility Unlock the full potential of your Intel/AMD based device. 项目地址: https://gitcode.com/gh_mirrors/un/Universal-x86-Tuning-Utility …...

财务BP,财务,会计,到底有什么区别?一文帮你分清财务BP,财务,会计!

最近我发现一个挺普遍的现象&#xff1a;很多财务同行&#xff0c;哪怕已经坐到了CFO的位置&#xff0c;依然分不清财务BP、会计和财务的区别。大家总觉得它们都跟钱有关&#xff0c;可真要说谁具体负责什么、区别在哪&#xff0c;又讲不清楚。我也在财务行业干了十多年了&…...

IPM驱动电路自举电容充电老出问题?可能是你的快恢复二极管(如1N4148)选错了

IPM驱动电路自举电容充电故障排查&#xff1a;快恢复二极管选型实战指南 引言 在电机驱动和变频器设计中&#xff0c;IPM模块的自举电路可靠性直接关系到整个系统的稳定性。许多工程师都遇到过这样的困扰&#xff1a;明明电路设计符合理论计算&#xff0c;上电后自举电容却总是…...

能效AI与领域专用模型:技术解析与应用实践

1. 能效AI的现状与挑战当前AI领域正面临着一个关键矛盾&#xff1a;模型性能的指数级提升与能源消耗的急剧增长。以GPT-4为例&#xff0c;其训练过程消耗了50-60GWh的电力&#xff0c;相当于一个小型城市数月的用电量。这种资源消耗模式显然不可持续&#xff0c;尤其考虑到到20…...

APP软件测试:内容与方法剖析

随着移动互联网的迅猛发展&#xff0c;APP软件已成为我们日常生活中不可或缺的一部分。然而&#xff0c;一款优秀的APP不仅要有吸引人的功能和界面设计&#xff0c;更要有出色的稳定性和安全性 。因此&#xff0c;APP软件测试在开发过程中显得尤为重要。本文将全面解析APP软件测…...

单入射方向光波导耦合光栅的优化

摘要 将光耦合到光波导在现代光学的各种应用中具有重要意义。在VirtualLab Fusion中&#xff0c;使用傅里叶模态法(FMM&#xff0c;也称为RCWA)和参数优化工具&#xff0c;可以优化真实的光栅几何形状&#xff0c;以实现特定衍射级次的最佳耦合效率。本例展示了针对特定入射方…...