一方面修改增大monitor的超时时间在线修改的方法如下:
另一方面,发现系统负载过重经常跑到100%的CPU,即使没有HA这档子事也是个不稳定因素 通过修妀应用,迁移大部分的读负载到SLave上有效减轻了Master的压力。
GitHub遇到过类似的故障由于迁移到Master负载过高,进而Percona Replication Manager的健康检查失败进行了切换切換后新主的缓存是冷的,负载同样过高又切回去。 (幸运的是我们的方案有3次迁移阈值的保护不会立刻切。)GitHub权衡后的对策居然是放棄自动切换只能由人工发起。
另Pacemkaer的论坛有几件高负载导致corosync token超时的问题,同样由于相关job不能及时得到OS调度所致该问题虚机上容易发生,特别是有超分的情况下解决办法是加大token超时时间。
于是手工修改为node2,再reload一下就OK了
至于什么原因导致的,又仔细查看了一下RA脚本未发现疑点,而现场已经不在无从查起,只能等下次遇到再说
迁移关键看怎么迁反正我的我鈈知道为什么在不同的机器上迁移老失败,我一般是导出然后再导入
你对这个回答的评价是?
你对这个回答的评价是
下载百度知道APP,抢鲜体验
使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案