行业互联网|《数据安全能力成熟度模型》实践指南:网络可用性管理( 三 )


3)快速检错
实现快速检错包括故障检测和故障诊断两方面,故障检测的作用是确定故障是否存在,故障诊断的作用是确定故障的位置 。一般快速检错是从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源具体包括:
①自动检错而不是人工检错可以更快提高检错的速度;
②借助线路检测工具(如线缆测试仪、时间域反射计)可以加快线路故障的检错速度;
③利用网络管理系统专门的管理进程不断地检测路由器的关键数据并及时给出报警可以加快路由器故障的检测速度;
④通过工具自动监视主机流量、扫描主机端口和服务来检测主机的异常,可以加快主机故障的检测速度;
⑤利用网络测试仪可以自动定位网络故障源,找出故障点并显示其网络相关信息,从而加快逻辑故障的检测速度;
⑥利用网络分析工具进行快速检错,如协议分析程序Snigger,操作系统中内置的一些非常有用的软件网络测试工具等;
4)快速排错(恢复)
排错事在网络出现故障时,逐一排除故障,恢复系统的可用性 。网络故障排错的方法分为:
①分层故障排错法:它主要根据网络分层的概念进行逐步分析的方法;
②分块故障排错法:此方法从设备的配置文件入手,将配置文件分为管理部分、端口部分、路由协议部分、策略部分和接入部分,并对其逐一进行检查排错;
③分段故障排错法:此方法是把网络分段,逐段排除故障;
【行业互联网|《数据安全能力成熟度模型》实践指南:网络可用性管理】④替换法:替换法是检查硬件问题最常用的方法 。如怀疑是网线问题时,更换一根确定完好的网线尝试 。
受限于篇幅,此处技术工具不进行进一步展开,在网络系统的不同建设阶段,我们可以选择性的引入不同的技术工具,这里我们按照网络系统建设的三个阶段:网络系统设计期、网络系统建设期、网络系统维护期来理解技术工具的使用
网络系统设计期:网络系统设计期的时候,网络系统还处于不完整的状态,在这个阶段,可以根据避错措施中涉及的各方面,对网络系统涉及到的硬件、软件进行选型,在经济许可的情况下,选择技术成熟可靠的软硬件等策略来防止网络系统的错误产生
网络系统建设期:网络系统建设期时,此时网络基本可用,为防止突发的网络事故导致网络不可用的情况,此时引入容错措施,通过硬件或软件的负载均衡增加网络可靠性 。
行业互联网|《数据安全能力成熟度模型》实践指南:网络可用性管理
文章图片
网络系统维护期:通过前面的避错、容错措施的建设,网络可用性大大增强,同时网络出错的概率也大大降低,此时主要是针对日常网络系统的监控、检错、排错,使用相关技术工具,不断减少平均修复时间,从而实现网络可用性的全维度把控 。


推荐阅读