大数据&云计算7月数据库技术通讯:LINUX OS配置问题导致数据库重启( 二 )


发现数据库的asm实例也出现异常 。
分析gipc日志:
2020-06-15 05:39:45.691: [GIPCDMON][1163826944] gipcdMonitorCssCheck: found node testrac22020-06-15 05:39:45.691: [GIPCDMON][1163826944] gipcdMonitorCssCheck: updating timeout node testrac22020-06-15 05:39:45.691: [GIPCDMON][1163826944] gipcdMonitorCssCheck: updating timeout node testrac22020-06-15 05:39:45.691: [GIPCDMON][1163826944] gipcdMonitorFailZombieNodes: skipping live node "testrac2", time 0 ms, endp 0000000000000000, 00000000000008b92020-06-15 05:39:45.691: [GIPCDMON][1163826944] gipcdMonitorFailZombieNodes: skipping live node "testrac2", time 0 ms, endp 0000000000000000, 0000000000000a092020-06-15 05:39:46.443: [GIPCDCLT][1168029440] gipcdClientThread: req from local client of type gipcdmsgtypeInterfaceMetrics, endp 00000000000003d52020-06-15 05:39:48.948: [ CLSINET][1163826944] Returning NETDATA: 1 interfaces2020-06-15 05:39:48.948: [ CLSINET][1163826944] # 0 Interface "bond1",ip="172.1.2.108",mac="90-e2-ba-eb-98-4c",mask="255.255.255.0",net="172.1.2.0",use="cluster_interconnect"2020-06-15 05:39:48.998: [GIPCDMON][1163826944] gipcdMonitorSaveInfMetrics: inf[ 0] bond1 - rank 99, avgms 0.346535 [ 160 / 206 / 202 ]2020-06-15 05:39:48.998: [GIPCDMON][1163826944] gipcdMonitorSaveInfMetrics: saving: bond1:992020-06-15 05:39:49.432: [GIPCDCLT][1168029440] gipcdClientThread: req from local client of type gipcdmsgtypeInterfaceMetrics, endp 00000000000004722020-06-15 05:39:50.452: [GIPCDCLT][1168029440] gipcdClientThread: req from local client of type gipcdmsgtypeInterfaceMetrics, endp 00000000000001212020-06-15 05:39:50.690: [GIPCDCLT][1168029440] gipcdClientThread: req from local client of type gipcdmsgtypeInterfaceMetrics, endp 000000000000032f
集群的心跳一直处于正常状态 。
asm agent日志:
2020-06-15 05:31:44.452: [ora.asm][1207957248]{0:0:2} [check] ConnectionPool::removeConnection connection count 02020-06-15 05:31:44.452: [ora.asm][1207957248]{0:0:2} [check] ConnectionPool::removeConnection freed 02020-06-15 05:31:44.452: [ora.asm][1207957248]{0:0:2} [check] ConnectionPool::stopConnection sid +ASM1 status 12020-06-15 05:31:44.452: [ora.asm][1207957248]{0:0:2} [check] InstAgent::check 1 prev clsagfw_res_status 3 current clsagfw_res_status 52020-06-15 05:31:44.453: [ AGFW][1205856000]{0:0:2} ora.asm 1 1 state changed from: UNKNOWN to: FAILED
asm的资源已经offline 。
查看数据库ash发现 , 故障前一段时间 , 数据库在做备份的动作:
大数据&云计算7月数据库技术通讯:LINUX OS配置问题导致数据库重启
本文插图

大数据&云计算7月数据库技术通讯:LINUX OS配置问题导致数据库重启
本文插图
大数据&云计算7月数据库技术通讯:LINUX OS配置问题导致数据库重启
本文插图
磁盘有大量的写入操作 , 并且有大量的换入换出动作 。
大数据&云计算7月数据库技术通讯:LINUX OS配置问题导致数据库重启
本文插图
ASH里会话都被sid 3046阻塞 , 3046会话是ckpt进程 。
大数据&云计算7月数据库技术通讯:LINUX OS配置问题导致数据库重启


推荐阅读