xx科技MHA脚本 arp广播异常_分析
1.分析及解决方案概述
分析原因
通过对现有信息的分析,可以看到arp广播异常是由于交换机缓存引起。
对于不同网段vlan间通信需要通过网关进行,但是网关的MAC地址表缓存的MAC-IP关系表默认300秒(交换机默认老化时间)甚至更长时间进行更新。
解决方案
针对现有情况,建议如下:
1)清理交换机MAC地址表缓存,确保MAC正确
2)在VIP所在主机进行一次ARP广播,确保网关知道最新的MAC(修改MHA脚本自动化实现)
后续计划 修改MHA脚本,加入arp相关命令行。
2.问题描述
03月7日MHA架构MySQL测试failover失败,未导致系统/业务发生重启/业务中断,未产生不良影响,后通过清理交换机MAC地址表缓存,确保MAC正确,不同vlan间通信恢复,需要从根本上分析问题原因,避免该类问题再次发生;
操作系统版本 RHEL 7
数据库架构 MHA
数据库版本 MySQL 8.0.45
业务名称 xxx
3.问题分析
3.1问题现象
MHA架构MySQL测试failover失败,无法和最新的VIP通信
![]()
没来得及记录,现象是同网段和这个VIP地址通信成功,不同网段和这个VIP地址通信失败
3.2MHA配置文件分析
未发现异常

3.3MAC地址分析
可以发现VIP漂移后,对应主机的MAC地址改变

立即清理交换机arp缓存,或者在VIP主机执行以下命令行
到交换机查看对应MAC-IP地址表,可以发现MAC地址和生存时间改变


3.4MHA脚本分析
可以发现定义了arp广播,但是没有调用


3.5问题分析总结
综合上述分析,我们可以看到:
arp广播异常是由于交换机缓存引起。
对于不同网段vlan间通信需要通过网关进行,但是网关的MAC地址表缓存的MAC-IP关系表默认300秒(交换机默认老化时间)甚至更长时间进行更新。
4.处理/优化建议
针对现有情况,建议如下:
1)清理交换机MAC地址表缓存,确保MAC正确
2)在VIP所在主机进行一次ARP广播,确保网关知道最新的MAC(修改MHA脚本自动化实现)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)