当前位置: 首页 > article >正文

PowerDNS主从架构实战:构建高可用内网DNS解析系统

1. 为什么你需要一个高可用的内网DNS系统如果你在公司里负责过运维或者开发肯定遇到过这种场景某个内部系统突然访问不了了一查发现是DNS解析出了问题。可能是负责解析的服务器挂了也可能是配置被误改了。这时候业务可能就卡住了开发、测试、运维同学都跑来找你压力山大。尤其是在微服务和容器化流行的今天服务发现、服务间调用哪个都离不开稳定、快速的DNS解析。我见过不少团队内网DNS就是随便找台服务器装个BIND或者Dnsmasq单点运行。平时没事一出事就是大事。后来我们决定用PowerDNS来搭建一套主从架构的高可用内网DNS系统彻底解决这个问题。PowerDNS不像传统的BIND那样依赖文本区域文件它把所有的DNS记录都存在数据库里比如MySQL这个设计让它天生就适合做主从同步和集群部署。主节点负责写入从节点自动同步数据并提供查询服务任何一台机器宕机解析服务都不会中断。这套架构听起来有点复杂但实际搭建起来比想象中要简单很多。接下来我就手把手带你走一遍从零开始用PowerDNS构建一个高可用内网DNS解析系统的全过程。我会把每一步的配置、背后的原理还有我踩过的那些坑都毫无保留地分享给你。2. 环境规划与基础软件安装在开始动手之前我们得先把蓝图规划好。一个典型的最小化高可用架构至少需要三台服务器一台主MasterPowerDNS两台从SlavePowerDNS。数据库我们选择MySQL它稳定大家也熟悉。为了管理方便我们还会部署一个Web管理界面pdns-admin。2.1 服务器与角色分配假设我们有三台内网服务器IP地址规划如下192.168.1.131 作为Master PDNS节点同时安装MySQL数据库和pdns-admin管理界面。192.168.1.132 作为Slave PDNS节点一。192.168.1.133 作为Slave PDNS节点二。为什么把数据库和Master放一起主要是为了简化初期的部署。在生产环境中如果对数据库有更高的可用性要求可以考虑使用MySQL的主从复制或者Galera集群但那又是另一个话题了。我们今天先聚焦在PowerDNS自身的主从同步上。所有服务器我们统一使用CentOS 7.x系统。首先在三台服务器上都进行基础的系统更新和依赖包安装# 更新系统并安装常用工具 yum update -y yum install -y vim wget curl net-tools epel-release2.2 在Master节点安装与配置MySQL我们的Master节点131需要充当数据库服务器。PowerDNS支持多种后端但MySQL是最常用、社区支持最好的一个。# 下载并安装MySQL官方Yum仓库 wget https://dev.mysql.com/get/mysql57-community-release-el7-11.noarch.rpm rpm -ivh mysql57-community-release-el7-11.noarch.rpm # 安装MySQL服务器跳过GPG检查某些环境下需要 yum -y install mysql-community-server --nogpgcheck # 启动MySQL服务并设置开机自启 systemctl start mysqld systemctl enable mysqld安装完成后MySQL会生成一个临时密码我们需要找到它并修改。# 从日志中查找初始密码 grep temporary password /var/log/mysqld.log # 输出类似A temporary password is generated for rootlocalhost: xxxxxxxx # 使用初始密码登录 mysql -uroot -p登录后第一件事就是修改root密码。MySQL 5.7的密码策略默认很严格为了方便测试我们先降低策略要求但请记住在生产环境中你应该使用符合策略的强密码。-- 登录MySQL后执行 -- 设置密码策略为低仅用于实验环境 SET GLOBAL validate_password_policy 0; SET GLOBAL validate_password_length 4; -- 修改root用户密码 ALTER USER rootlocalhost IDENTIFIED BY YourStrongPassword123!; -- 允许root用户远程登录根据安全要求可选 GRANT ALL PRIVILEGES ON *.* TO root% IDENTIFIED BY YourStrongPassword123! WITH GRANT OPTION; FLUSH PRIVILEGES;接下来为PowerDNS创建专用的数据库和用户。-- 创建PowerDNS数据库 CREATE DATABASE powerdns CHARACTER SET utf8 COLLATE utf8_general_ci; -- 创建PowerDNS专用用户并授权 CREATE USER powerdns% IDENTIFIED BY PowerDNS_User_Pass123!; GRANT ALL ON powerdns.* TO powerdns%; -- 授予PROCESS权限某些PowerDNS操作需要 GRANT PROCESS ON powerdns.* TO powerdns%; FLUSH PRIVILEGES;数据库部分就准备好了。这里有个小建议你可以把上面这些SQL命令写成一个脚本文件比如init_pdns_db.sql下次部署时直接source就行能省不少事。2.3 在三台节点上安装PowerDNSPowerDNS有官方的Yum仓库安装起来非常方便。我们需要在三台服务器上都安装PowerDNS的主程序以及MySQL后端支持。# 1. 安装EPEL仓库和优先级插件 yum install epel-release yum-plugin-priorities -y # 2. 添加PowerDNS官方认证服务器Authoritative Server仓库 # 注意我们安装的是权威服务器版本不是递归解析器版本。 curl -o /etc/yum.repos.d/powerdns-auth-49.repo https://repo.powerdns.com/repo-files/centos-auth-49.repo # 3. 安装PowerDNS及其MySQL后端 yum install pdns pdns-backend-mysql -y安装完成后在Master节点131上初始化数据库表结构。PowerDNS的MySQL后端包自带了一个SQL schema文件。# 切换到schema文件所在目录并导入 mysql -uroot -pYourStrongPassword123! powerdns /usr/share/doc/pdns-backend-mysql-*/schema.mysql.sql你可以登录MySQL验证一下表是否创建成功USE powerdns; SHOW TABLES;应该能看到domains,records,supermasters等核心表。3. 核心配置区分Master与Slave这是最关键的一步主从节点的配置差异主要就体现在这里。PowerDNS的主从同步机制AXFR/IXFR就是通过配置文件中的几个关键参数来控制的。3.1 Master节点配置详解编辑Master节点131上的/etc/pdns/pdns.conf配置文件。你可以先备份原文件然后进行修改。cp /etc/pdns/pdns.conf /etc/pdns/pdns.conf.bak vim /etc/pdns/pdns.conf我们需要在配置文件中明确指定几个核心参数# 基础身份与安全 setgidpdns setuidpdns # 后端数据库连接配置 (所有节点都需要指向Master的数据库) launchgmysql gmysql-host192.168.1.131 # Master数据库IP gmysql-dbnamepowerdns gmysql-userpowerdns gmysql-passwordPowerDNS_User_Pass123! gmysql-port3306 # 服务监听设置 local-address0.0.0.0 # 监听所有IP local-port54 # 使用非标准端口54避免与系统可能存在的53端口服务冲突 # 启用API为pdns-admin和管理命令提供接口 apiyes api-keyYourSecretApiKeyForPdns123! # 务必改为一个复杂的密钥 webserveryes webserver-address0.0.0.0 webserver-port8081 webserver-allow-from0.0.0.0/0, ::/0 # 生产环境应限制访问IP # 主从同步相关核心配置 (仅Master需要) primaryyes # 声明本机是主服务器 # 同步检测间隔秒。Master会定期检查域是否有更新。 # 设置太短会增加数据库压力太长则同步延迟高。300秒5分钟是个折中的选择。 xfr-cycle-interval300 # 通知列表。当域有更新时Master会主动通知这些Slave节点。 # 这是实现快速同步的关键否则Slave只能等到刷新周期SOA中的refresh才被动检查。 also-notify192.168.1.132:54, 192.168.1.133:54 # 允许这些IP地址进行区域传输AXFR。必须包含所有Slave节点的IP。 allow-axfr-ips192.168.1.0/24 # 允许来自这些IP的DNS动态更新DDNS可根据需要设置。 allow-dnsupdate-from192.168.1.0/24 # 日志记录调试时非常有用 log-dns-queriesyes log-dns-detailsyes loglevel3 # 信息级别日志重点解释一下also-notify和xfr-cycle-intervalalso-notify 这是“推”模式。当Master上的某个域Zone的序列号Serial增加时意味着记录有变动它会立即向这个列表中的所有Slave发送一个NOTIFY消息。Slave收到通知后会立即发起区域传输请求从而实现近乎实时的同步。xfr-cycle-interval 这是“拉”模式的双重保险。Master会每隔这个时间主动扫描一次所有域检查序列号是否有变化。如果发现变化但NOTIFY可能因为网络问题失败它依然会尝试通知Slave。所以即使also-notify失败了最坏情况下Slave也只需要等待xfr-cycle-interval设定的时间就能发现更新。3.2 Slave节点配置详解Slave节点132和133的配置大部分与Master相同但有几个关键区别。编辑Slave节点的/etc/pdns/pdns.conf# 基础身份、数据库连接、监听端口、API配置与Master相同确保数据库连接指向Master的数据库IP192.168.1.131 setgidpdns setuidpdns launchgmysql gmysql-host192.168.1.131 gmysql-dbnamepowerdns gmysql-userpowerdns gmysql-passwordPowerDNS_User_Pass123! gmysql-port3306 local-address0.0.0.0 local-port54 apiyes api-keyYourSecretApiKeyForPdns123! # 可以和Master不同但pdns-admin管理时需要对应 webserveryes webserver-address0.0.0.0 webserver-port8081 webserver-allow-from0.0.0.0/0, ::/0 # 核心区别声明本机为从服务器 secondaryyes # Slave不需要 also-notify 和 xfr-cycle-interval 配置 # allow-axfr-ips 在Slave上通常不需要因为它是接收方而非提供方关键点所有节点Master和Slave的gmysql-host都指向Master的数据库192.168.1.131。这是因为在初始的主从架构中我们让Slave也直接读取Master的数据库吗不这里有个重要的理解偏差。在实际的主从同步中Slave节点不应该直接连接Master的数据库。正确的流程是Slave通过DNS协议AXFR从Master拉取整个区域的数据。Slave将这些数据写入自己本地的数据库中。 因此Slave的pdns.conf里配置的数据库连接应该是连接到自己本机的另一个MySQL实例或者是一个专门为Slave服务的数据库。让所有节点连同一个数据库那就成了“共享数据库”模式而不是“主从同步”模式了。那为什么很多教程包括我们上面的简化配置都让Slave连Master的DB这是一种快速验证的“偷懒”做法或者叫“Native”模式。在这种模式下所有PDNS实例都读写同一个数据库依靠数据库自身的主从复制如MySQL Replication来实现数据同步PowerDNS自身不负责同步。这确实是一种高可用方案但它不是PowerDNS原生的主从Primary-Secondary同步。为了演示真正的PowerDNS主从同步我们需要为每个Slave节点配置自己的本地数据库。步骤和Master类似在Slave节点安装MySQL或连接另一个MySQL实例。创建相同的powerdns数据库和用户。导入相同的schema。修改Slave的pdns.conf将gmysql-host指向127.0.0.1或本地数据库地址。这样Master和Slave就各有自己独立的数据库。Master的数据库是权威数据源Slave的数据库最初是空的通过AXFR从Master同步后填充。3.3 启动服务与验证基础状态配置完成后在三台服务器上启动PowerDNS服务并设置开机自启。systemctl enable pdns --now systemctl status pdns # 检查服务状态确保是 active (running)检查服务是否在监听54端口netstat -tulnp | grep 54 # 应该能看到 pdns 进程在监听 0.0.0.0:54如果启动失败可以查看日志定位问题journalctl -u pdns -f # 实时查看日志 tail -f /var/log/messages # 也可能写在这里4. 实战主从同步从添加第一个域名开始服务跑起来了现在我们来创建第一个域名并观察主从同步是如何发生的。这里我们会用到PowerDNS自带的强大命令行工具pdnsutil。4.1 在Master上创建并配置主区域Master Zone假设我们要为内网创建一个测试域名internal.company.com。在Master节点131上执行# 1. 创建区域Zone初始类型为Native简单存储 pdnsutil create-zone internal.company.com # 2. 将区域类型设置为 MASTERPrimary pdnsutil set-kind internal.company.com primary # 3. 设置SOA记录的编辑策略为 INCREASE # 这是至关重要的一步它确保每次区域更改时SOA序列号会自动递增。 # 如果使用 DEFAULT序列号基于日期一天内修改超过99次会出问题。 pdnsutil set-meta internal.company.com SOA-EDIT-API INCREASE现在登录Master的MySQL数据库查看一下发生了什么USE powerdns; SELECT * FROM domains WHERE nameinternal.company.com; SELECT * FROM records WHERE nameinternal.company.com AND typeSOA;你会看到domains表里多了一条记录type字段应该是MASTER。records表里多了一条SOA记录它的content字段类似ns1.internal.company.com hostmaster.internal.company.com 1 10800 3600 604800 3600。其中1就是当前的序列号serial。4.2 手动触发从Master到Slave的同步现在Master上有了一个域我们需要让Slave知道它并开始同步。这就是“创建从区域”Secondary Zone的过程。在Slave节点132或133上执行# 在Slave上告诉它去Master那里同步 internal.company.com 这个域 pdnsutil create-secondary-zone internal.company.com 192.168.1.131:54这个命令做了几件事在Slave本地的domains表中插入一条记录type设置为SLAVE并记录Master的地址。立即向指定的Master131:54发起一次区域传输AXFR请求。将获取到的所有DNS记录A SOA NS等存入Slave自己的records表中。你可以立即在Slave节点上检查是否同步成功# 在Slave节点上列出该域的所有记录 pdnsutil list-zone internal.company.com如果看到和Master上一样的SOA、NS等记录说明首次同步成功了。你也可以查看Slave的数据库确认records表里有了数据。4.3 理解自动同步机制首次同步是手动的那之后的更新如何自动同步呢这依赖于我们前面配置的两个机制SOA刷新机制Pull 每个Slave会根据域SOA记录中定义的refresh时间默认10800秒3小时定期向Master查询SOA序列号。如果发现Master的序列号比自己本地的大就会发起增量传输IXFR或完全传输AXFR来更新数据。NOTIFY机制Push 当Master上的域记录被更改通过pdns-admin或pdnsutil序列号增加。Master会立即向also-notify列表中配置的所有Slave发送NOTIFY消息。Slave收到后在几秒内就会发起一次SOA查询和区域传输实现近乎实时的同步。所以also-notify是实现快速同步的关键。如果没有它Slave可能要等3小时才知道有更新。4.4 测试同步添加一条A记录让我们来实际测试一下。在Master节点上为域名添加一条A记录pdnsutil add-record internal.company.com web A 300 192.168.1.100这条命令添加了一条记录主机名web.internal.company.com指向IP192.168.1.100TTL为300秒。添加完成后立即检查Master的SOA序列号pdnsutil show-zone internal.company.com | grep SOA或者查看数据库SELECT content FROM records WHERE nameinternal.company.com AND typeSOA;你会发现序列号content的第三部分从1自动增加到了2。这就是SOA-EDIT-API INCREASE在起作用。现在等待几秒钟然后在Slave节点上执行pdnsutil list-zone internal.company.com | grep web你应该能看到这条新添加的A记录。如果没看到可以尝试在Slave上手动触发一次检查# 在Slave上强制检查并更新该区域 pdns_control retrieve internal.company.com然后再列出记录查看。如果还不行就去查看Master和Slave的日志journalctl -u pdns看看NOTIFY消息是否发送成功或者是否有传输错误。5. 引入pdns-admin可视化管理如此简单一直用命令行管理虽然很酷但毕竟不方便特别是记录多的时候。pdns-admin是一个用Python/Flask写的PowerDNS Web管理界面功能强大界面友好用Docker部署非常方便。5.1 在Master节点部署pdns-admin我们选择在Master节点131上部署pdns-admin用来管理所有的域。首先确保Docker和Docker Compose已经安装。然后创建一个工作目录mkdir -p /opt/pdns-admin cd /opt/pdns-admin创建docker-compose.yml文件version: 3 services: powerdns-admin: container_name: pdns-admin image: ngoduykhanh/powerdns-admin:latest restart: always ports: - 9191:80 environment: - SQLALCHEMY_DATABASE_URImysql://powerdns_admin:AdminPass123!192.168.1.131:3306/powerdns_admin_db - GUNICORN_TIMEOUT300 - OFFLINE_MODEFalse volumes: - ./data:/data networks: - pdns-net networks: pdns-net: driver: bridge注意环境变量SQLALCHEMY_DATABASE_URIpdns-admin需要自己的数据库来存储用户、权限等管理信息这个库和PowerDNS存DNS记录的powerdns库是分开的。所以我们需要先创建这个库。在Master的MySQL上执行CREATE DATABASE powerdns_admin_db CHARACTER SET utf8 COLLATE utf8_general_ci; CREATE USER powerdns_admin% IDENTIFIED BY AdminPass123!; GRANT ALL PRIVILEGES ON powerdns_admin_db.* TO powerdns_admin%; FLUSH PRIVILEGES;现在启动pdns-admin容器docker-compose up -d访问http://192.168.1.131:9191你应该能看到登录页面。第一次访问需要创建管理员账户。5.2 配置pdns-admin连接PowerDNS API登录后第一件事是添加PowerDNS服务器。点击左侧“Servers”然后“Add Server”。Name 填写一个易记的名字如 “PDNS-Master”。Description 可选。API URL 填写Master节点的API地址http://192.168.1.131:8081。API Key 填写我们在Master的pdns.conf中设置的api-key即YourSecretApiKeyForPdns123!。Verify SSL 内网环境可以取消勾选。点击“Save”。如果连接成功页面会显示 “Server is alive”。现在你就可以在Web界面上看到我们之前用命令行创建的internal.company.com域了可以图形化地添加、删除、修改记录比命令行方便太多。5.3 在pdns-admin中管理主从域在pdns-admin中添加新域时类型Type的选择非常重要Native 选择这个意味着这个域的数据完全由当前连接的PowerDNS服务器我们配置的Master管理不涉及PowerDNS层面的主从同步。如果你后端数据库用了MySQL主从复制那么其他连同样数据库的PDNS实例也能读到数据。这更像一个“共享数据库”模式。Master 选择这个表示这台PowerDNS服务器是这个域的权威主服务器。它会生成序列号并可以配置also-notify来通知Slave。这是我们主从架构中Master域应该选择的类型。Slave 在Slave服务器的pdns-admin上如果你部署了添加域时选择这个。你需要指定Master服务器的地址和端口。这相当于执行了pdnsutil create-secondary-zone命令。最佳实践建议 在Master节点的pdns-admin上将所有需要主从同步的域都创建为Master类型。然后在每个Slave节点的pdns-admin上或通过命令行将这些域添加为Slave类型指向Master的IP和端口。5.4 一个关于SOA序列号的“坑”在pdns-admin上编辑域时注意SOA-EDIT-API这个参数。如果你在创建域时没有像我们之前用命令行那样显式设置为INCREASEpdns-admin可能会默认使用DEFAULT。DEFAULT模式使用YYYYMMDDNN格式作为序列号。例如2024041501。这里有个大坑如果一天内你对这个域的修改次数超过了99次NN从01到99序列号就会变成20240415100这会导致NN部分溢出覆盖掉日期部分的前几位可能被Slave误认为是一个更旧的序列号从而导致同步失败。所以务必在创建Master域后将其SOA-EDIT-API策略设置为INCREASE。在pdns-admin的域编辑页面可以找到这个选项并修改。设置为INCREASE后每次修改序列号单纯地1简单可靠。6. 让解析更高效引入pdns-recursor和dnsdist现在我们有了高可用的权威DNS服务器PowerDNS主从。但客户端通常需要的是递归解析服务我给它一个域名它要能帮我查出最终的IP包括向外部互联网DNS的查询。PowerDNS Authoritative Server我们刚装的是权威服务器只负责回答它“管辖”的域如我们的internal.company.com。对于它不知道的域比如www.baidu.com它不会去递归查询。因此我们需要在客户端和权威服务器之间搭建一个递归解析器Recursor和/或一个负载均衡器。6.1 部署pdns-recursor作为递归前端pdns-recursor是PowerDNS项目下的高性能递归解析器。我们可以把它部署在每一台PowerDNS服务器上或者独立的服务器上。它的作用是接收客户端的DNS查询请求。如果查询的是我们内网的域如*.internal.company.com它就转发给后端的PowerDNS权威服务器主从集群。如果查询的是外网域名它就自己进行递归查询从根域名服务器开始一层层查并将结果缓存起来加速后续相同查询。在每台PowerDNS服务器131132133上安装pdns-recursor# 添加recursor仓库 curl -o /etc/yum.repos.d/powerdns-rec-51.repo https://repo.powerdns.com/repo-files/el-rec-51.repo yum install pdns-recursor -y编辑配置文件/etc/pdns-recursor/recursor.conf关键配置如下# 监听端口设为标准的53端口 local-address0.0.0.0 local-port53 # 允许来自内网的查询 allow-from192.168.1.0/24, 127.0.0.0/8 # 转发区域配置将特定域转发到我们的PowerDNS集群 forward-zonesinternal.company.com192.168.1.131:54;192.168.1.132:54;192.168.1.133:54 # 默认的递归上游DNS服务器 forward-zones-recurse.:223.5.5.5,114.114.114.114 # 关闭DNSSEC验证内网环境可简化配置 dnssecoff # 更多缓存和性能调整可选 max-cache-entries1000000 threads4配置解释forward-zones: 这一行是核心。它告诉recursor所有对于internal.company.com及其子域的查询不要自己递归而是转发到后面列出的PowerDNS服务器地址我们的主从集群。这里列出了三个recursor会按顺序尝试提供了简单的故障转移。forward-zones-recurse: 这是一个“兜底”设置。对于所有不匹配forward-zones的查询即非内网域名递归解析器将使用这里指定的公共DNS如223.5.5.5进行递归查询。将local-port设为53这样客户端就可以直接向这台服务器的53端口发起DNS请求了。启动服务systemctl enable pdns-recursor --now现在你可以将内网客户端的DNS服务器指向192.168.1.131或其他安装了recursor的节点。客户端既能解析web.internal.company.com也能正常上网。6.2 使用dnsdist实现智能负载均衡与流量管理如果你有多个recursor实例或者希望有更强大的流量管理、监控、安全策略那么dnsdist是更好的选择。它是一个高性能的DNS负载均衡器、分发器和防火墙。假设我们有一台新的服务器192.168.1.140专门用来跑dnsdist。安装步骤如下# 添加dnsdist仓库 curl -o /etc/yum.repos.d/powerdns-dnsdist-19.repo https://repo.powerdns.com/repo-files/el-dnsdist-19.repo yum install dnsdist -y编辑/etc/dnsdist/dnsdist.conf一个基础的负载均衡配置如下-- 监听所有IP的53端口 addLocal(0.0.0.0:53) -- 设置访问控制列表只允许内网网段查询 setACL({192.168.1.0/24, 10.0.0.0/8}) -- 定义下游服务器池这里是我们三台服务器上的recursor -- newServer() 可以添加多个后端并支持设置权重、检查等参数 newServer({address192.168.1.131:53, namepdns-recursor-131, checkInterval1000, poolinternal}) newServer({address192.168.1.132:53, namepdns-recursor-132, checkInterval1000, poolinternal}) newServer({address192.168.1.133:53, namepdns-recursor-133, checkInterval1000, poolinternal}) -- 设置负载均衡策略推荐使用 whashed 或 roundrobin -- whashed: 相同域名的查询会被哈希到固定的后端有利于利用后端缓存 setServerPolicy(whashed) -- 启用Web管理界面和监控Prometheus metrics webserver(0.0.0.0:8083) setWebserverConfig({password$(生成一个哈希密码), apiKey$(生成一个API密钥)})启动dnsdistsystemctl enable dnsdist --now现在你可以将内网所有客户端的DNS服务器指向192.168.1.140。dnsdist会将查询请求智能地分发给后端的三个recursor。任何一个recursor或后端的PowerDNS宕机dnsdist都能自动检测并将其从健康池中移除实现服务的高可用。7. 故障转移与日常维护指南架构搭建好了但运维才刚刚开始。高可用不是一劳永逸的需要配合监控和运维手段。7.1 如何监控主从同步状态查看数据库序列号 最直接的方式是对比Master和Slave数据库中某个域的SOA序列号。-- 在Master数据库执行 SELECT content FROM records WHERE nameinternal.company.com AND typeSOA; -- 在Slave数据库执行同样的查询对比两个序列号是否一致。使用pdns_control工具# 在Master节点查看域的状态 pdns_control show-zone internal.company.com # 会输出序列号、记录数等信息。 # 在Slave节点检查域是否处于活动同步状态 pdns_control list-zones # 查看所有域确认Slave域存在且状态正常。通过pdns-admin界面 如果Slave节点也部署了pdns-admin并连接了API可以在界面上直接看到Slave域的状态和最后一次检查/传输的时间。日志监控 在PowerDNS的日志中journalctl -u pdns -f搜索AXFR、IXFR、NOTIFY等关键词可以观察到同步事件。7.2 当Master宕机时如何切换这是高可用架构必须考虑的场景。我们的架构中Slave是只读的不能直接在上面修改记录。如果Master永久性损坏我们需要将一个Slave提升为新的Master。手动切换步骤确认故障 确定Master节点131无法恢复。选择新的Master 假设我们选择Slave-1132作为新的主节点。修改Slave-1配置将其pdns.conf中的secondaryyes改为primaryyes。移除also-notify中对旧Master131的引用添加其他存活的Slave133。重启Slave-1上的pdns服务systemctl restart pdns。修改其他Slave配置 将其他Slave节点133的配置中指向旧Master131的地址改为指向新的Master132。可以通过pdnsutil change-secondary-zone-addr命令修改或者直接更新数据库。# 在Slave-2 (133) 上执行 pdnsutil change-secondary-zone-addr internal.company.com 192.168.1.132:54更新客户端或负载均衡器 如果之前有应用直接连接Master的API进行DDNS更新需要将API endpoint指向新的Master132。重建pdns-admin连接 如果pdns-admin部署在旧Master上需要在新Master上重新部署或者修改其连接配置。自动化思路 对于更严谨的生产环境可以考虑使用Keepalived或VIP虚拟IP来实现Master的IP漂移。让Master角色绑定在一个虚拟IP上当主节点宕机时VIP自动漂移到备节点这样客户端和Slave节点无需修改配置。但这需要更复杂的配置和对PowerDNS启动脚本的定制。7.3 日常备份与恢复备份什么PowerDNS数据库 这是最重要的。定期备份MySQL中的powerdns数据库。mysqldump -uroot -p powerdns /backup/powerdns_$(date %Y%m%d).sql配置文件 备份所有节点的/etc/pdns/pdns.conf/etc/pdns-recursor/recursor.conf/etc/dnsdist/dnsdist.conf。pdns-admin数据 备份pdns-admin的数据库powerdns_admin_db以及容器挂载卷/opt/pdns-admin/data。恢复演练 定期将备份文件在测试环境进行恢复演练确保备份有效。7.4 性能调优与问题排查小技巧连接数问题 如果遇到Cant create a new thread错误可能是MySQL连接数不足。检查MySQL的max_connections参数适当调大。同步延迟 如果发现Slave数据更新慢首先检查网络。然后可以适当减少Master的xfr-cycle-interval和域SOA记录中的refresh值但会增加负载。确保also-notify列表正确且网络可达。递归解析慢 检查pdns-recursor的缓存命中率。可以使用rec_control get-all查看统计信息。考虑增加max-cache-entries。使用pdns_control和rec_control 这两个命令行工具是运维利器。比如pdns_control ping测试服务pdns_control purge清理缓存rec_control wipe-cache example.com$清除某个域的所有缓存。搭建和维护一套高可用的内网DNS系统就像给整个内部网络修了一条稳定可靠的路标体系。一开始可能会觉得步骤繁琐但一旦跑起来你会发现它为运维带来的稳定性和便利性是巨大的。这套基于PowerDNS主从的架构我们团队已经稳定运行了两年多期间经历了服务器硬件更换、机房迁移DNS服务本身从未成为过瓶颈。希望这份详细的实战指南能帮你少走弯路一次搭建成功。如果在过程中遇到任何问题多看看日志那里面通常藏着答案。

相关文章:

PowerDNS主从架构实战:构建高可用内网DNS解析系统

1. 为什么你需要一个高可用的内网DNS系统? 如果你在公司里负责过运维或者开发,肯定遇到过这种场景:某个内部系统突然访问不了了,一查发现是DNS解析出了问题。可能是负责解析的服务器挂了,也可能是配置被误改了。这时候…...

【MoveIt 2】利用MoveIt任务构造器实现多阶段物体抓取与放置任务

1. 为什么需要MoveIt任务构造器?从“硬编码”到“乐高式”编程 如果你曾经尝试用MoveIt 2的MoveGroupInterface来写一个完整的“抓取-移动-放置”任务,我猜你大概率会经历一段“痛苦”的时光。我刚开始做机械臂应用的时候,也是这么过来的&…...

AI驱动文献综述:从选题到成稿的智能工作流与实战提示词

1. 从“文献焦虑”到“AI流水线”:我的综述写作革命 写文献综述,大概是每个研究生和青年学者都绕不开的“噩梦”。我还记得自己读博初期,面对海量文献时的那种窒息感:关键词一搜,几千篇论文跳出来,光是看标…...

STM32无RNG单元时,巧用ADC噪声与SysTick生成高随机性数值

1. 当你的STM32没有“骰子”时,怎么办? 玩过单片机开发的朋友都知道,随机数在很多场景里都扮演着关键角色。比如,你想做一个抽奖小游戏,或者让设备每次启动时生成一个唯一的ID,又或者在一些简单的加密场景里…...

MicroPython ESP32 UART Modbus 故障诊断与主从切换

1. 从“偷听”开始:理解UART监听Modbus的核心价值 大家好,我是老张,在工业自动化和物联网这块摸爬滚打了十几年。今天想和大家聊聊一个非常实用,但又常常被新手朋友觉得有点“玄乎”的场景:用一块小小的ESP32开发板&am…...

NOAA 中国区域 18 类地面气象要素逐日数据(1942-2025 年 8 月)汇总与 CSV 格式解析

一、引言 NOAA(美国国家海洋和大气管理局)的全球地面气象逐日数据集(GHCN-Daily/GSOD)是气象科研、气候分析、工程规划等领域的核心基础数据,涵盖全球超 10 万个气象站点的多维度观测记录。本文聚焦中国区域&#xff…...

eNSP实战:从零到一构建高可用无线校园网仿真方案

1. 为什么你需要用eNSP搞定一个高可用的无线校园网? 如果你是一名网络工程专业的学生,或者刚入行的网络工程师,面对“校园网”这个课题,是不是感觉头大?设备贵、环境复杂、不敢乱动真机……这些我都经历过。十年前我刚…...

Python之a2anet包语法、参数和实际应用案例

a2anet包概述 a2anet是一个用于实现Attention Aggregation Network (A2-Net) 架构的Python库,主要用于点云数据的深度学习处理。A2-Net是一种高效的点云特征提取网络,通过自注意力机制捕捉点之间的长距离关系,在点云分类、分割等任务中表现出…...

Python之a2a-agent-mcpserver-generator包语法、参数和实际应用案例

a2a-agent-mcpserver-generator 包功能概述 a2a-agent-mcpserver-generator 是一个专为Python设计的高级工具包,主要用于快速构建和部署多客户端服务器架构。它基于异步编程模型,支持多线程和协程,特别适合开发需要处理大量并发连接的网络应用…...

第8讲 数据库的设计与实施

一、数据库设计的特点1.数据库设计方法新奥尔良方法基于E-R模型的数据库设计方法基于3NF的设计方法对象定义语言(Object Definition Language,ODL)方法2.数据库设计的基本步骤1)需求分析获取需求是整个设计过程的基础。进行数据库设计时首先必须准确了解与分析用户的…...

Springboot+vue宠物领养救助平台的设计与实现

文章目录前言源码获取(稀缺资源,尽快转存到自己网盘,防止失效)详细视频演示具体实现截图后端框架SpringBoot前端框架Vue持久层框架MyBaits成功系统案例:参考代码数据库前言 博主介绍:CSDN特邀作者、985高校计算机专业…...

Springboot+vue房屋租赁管理系统的设计与实现

文章目录前言源码获取详细视频演示具体实现截图后端框架SpringBoot前端框架Vue持久层框架MyBaits成功系统案例:数据库前言 博主介绍:CSDN特邀作者、985高校计算机专业毕业、现任某互联网大厂高级全栈开发工程师、Gitee/掘金/华为云/阿里云/GitHub等平台持续输出高质…...

Windows下5分钟搞定内网穿透:qydev和飞鸽对比实测(附避坑指南)

Windows内网穿透实战:从零到精通的避坑与效率指南 最近在帮几个刚入行的朋友搭建本地开发环境的外部访问时,发现大家普遍对“内网穿透”这个概念既熟悉又陌生。熟悉的是,几乎每个开发者都遇到过需要临时把本地的Web服务、数据库或者测试API暴…...

全面指南:探索域名解析的五大实用方法

1. DNS查询:互联网的“电话本”是如何工作的? 每次你在浏览器里输入“www.baidu.com”并按下回车,到页面加载出来,这背后其实发生了一系列精密的“寻址”操作。这个把好记的域名翻译成计算机能识别的IP地址(比如“14.2…...

避坑指南:Simulink Scope导出数据总出错?这5个参数设置90%的人没搞对

避坑指南:Simulink Scope导出数据总出错?这5个参数设置90%的人没搞对 如果你经常和Simulink打交道,尤其是需要把Scope里那些漂亮的波形数据导出来,在MATLAB里做进一步分析、画报告图,或者存档,那你大概率踩…...

别让这些软件,偷走你新学期的效率!电脑卡顿元凶排查指南。

“开学才三天,电脑打开Word都要转圈圈!”“PPT做到一半直接卡死,差点想砸电脑!”这几天小A收到不少类似的私信:明明上学期还好好的,怎么新学期一开电脑就卡成PPT?(图片由AI生成&…...

开学焕新,一步到位!这台「全能学霸本」,让你从宿舍赢到图书馆

回想一下当年选电脑的自己,是不是满脑子的“性能拉满,游戏全开”,非高性能游戏本不选?结果呢,明明也不怎么玩游戏,愣是每天背着不够轻便的笔记本爬四五层楼,去教室、去图书馆、去自习室。还没毕…...

保姆级教程:在Ubuntu 22.04上为ROS2 Humble切换Cyclone DDS(含网卡指定技巧)

保姆级实战:在Ubuntu 22.04上为ROS2 Humble深度优化Cyclone DDS配置 最近在实验室调试一个多机器人协同项目,节点间通信时不时出现延迟抖动,排查了半天才发现,默认的通信中间件在复杂的网络拓扑下有点“力不从心”。和几位深耕机器…...

MobileNetV2实战:如何在树莓派上部署轻量级图像分类模型(附PyTorch代码)

从理论到实战:在树莓派上部署并极致优化MobileNetV2图像分类模型 当你在树莓派上尝试运行一个标准的ResNet-50模型时,可能会发现它慢得令人沮丧——推理一张224x224的图像可能需要数秒,这完全无法满足实时应用的需求。这正是轻量级神经网络架…...

华为防火墙+CentOS搭建GRE隧道实战:从端口映射到策略路由全解析

华为防火墙与CentOS GRE隧道实战:打通混合云网络的关键一步 最近在帮一家客户做混合云架构迁移,他们有个挺典型的需求:本地数据中心跑着核心业务,但部分服务想平滑迁移到公有云上,同时还得保证两边的应用能像在一个局域…...

SAP SQ01 用户权限查询 - AGR_USER 表关系解析与应用

1. 从SQ01查询说起:为什么AGR_USER表是权限管理的“核心枢纽” 如果你在SAP系统里做过权限相关的查询或者审计,大概率用过SQ01这个事务码。SQ01是SAP标准的查询工具,功能强大,但说实话,我第一次用它来查用户权限的时候…...

物流优化中的智能算法选择指南:何时用NS?LNS还是ALNS?

物流优化中的智能算法选择指南:何时用NS?LNS还是ALNS? 在物流与供应链管理的核心地带,无论是仓库里拣货员的行走路径,还是公路上运输车辆的调度排班,背后都隐藏着一个个复杂的组合优化难题。对于负责技术选…...

实战指南:Burp Suite 在安卓高版本模拟器中的HTTPS抓包与证书信任配置

1. 为什么安卓高版本抓包这么麻烦?从“信任”说起 大家好,我是老张,一个在安全测试这行摸爬滚打了十来年的老兵。今天咱们不聊虚的,就聊一个让很多刚入行的朋友头疼不已的问题:用Burp Suite抓安卓APP的HTTPS包&#xf…...

循环神经网络(RNN)在时序数据处理中的核心优势与应用场景解析

1. 为什么说RNN是处理“带记忆”数据的首选? 如果你用过传统的神经网络,比如前馈神经网络或者CNN来处理图片,你会发现它们有个特点:每次输入都是独立的。比如你给一张猫的图片,它输出“猫”;给一张狗的图片…...

CentOS8网络服务重启失败?试试这个NetworkManager的隐藏技巧

CentOS 8网络服务重启失败?试试这个NetworkManager的隐藏技巧 最近在CentOS 8上折腾服务器,不少朋友都遇到了一个看似简单却让人头疼的问题:想用经典的systemctl restart network命令重启网络服务,结果系统直接给你泼一盆冷水&…...

RFSOC XCZU47DR开发套件在5G射频基带与相控阵系统中的应用实践

1. 从“概念”到“信号”:为什么我们需要RFSOC XCZU47DR? 如果你正在捣鼓5G、相控阵雷达或者任何需要处理大量无线信号的玩意儿,那你肯定对“原型验证”这个词又爱又恨。爱的是,它意味着你的天才想法有机会变成现实;恨…...

告别Magnet!Hammerspoon窗口管理全攻略:从基础分屏到高级布局

告别Magnet!Hammerspoon窗口管理全攻略:从基础分屏到高级布局 如果你是一名Mac用户,并且每天需要与十几个窗口打交道——浏览器、代码编辑器、终端、文档、通讯软件——那么你一定对窗口管理这件事又爱又恨。爱的是macOS流畅的动画和精致的界…...

华为手机NFC车钥匙全攻略:从开通到使用,手把手教你告别实体钥匙

华为手机NFC车钥匙:从入门到精通,彻底解放你的口袋 不知道你有没有过这样的经历:急匆匆出门,走到车边一摸口袋,心里咯噔一下——车钥匙又忘带了。或者,在超市采购完,双手拎满购物袋,…...

高光谱数据处理实战:从.mat到真彩色图像的完整流程(含常见问题解答)

高光谱数据处理实战:从.mat到真彩色图像的完整流程(含常见问题解答) 你是否也曾面对一堆共享的.mat格式高光谱数据,感觉无从下手?明明知道里面藏着丰富的光谱信息,却卡在第一步——如何把它变成一张人眼能直…...

HCIP数通 vs 安全 vs 云计算:2024年华为认证方向选择指南(含薪资对比)

HCIP数通 vs 安全 vs 云计算:2024年华为认证方向选择指南(含薪资对比) 站在2024年的十字路口,如果你是一名网络工程师或者正在IT领域寻求突破的从业者,面对华为HCIP认证下琳琅满目的方向,感到一丝迷茫&…...