行业互联网|阳光保险:全链路监控平台( 二 )
项目第二批次时间段为2019年1月至2020年2月 。 期间主要对一期使用过程中的问题进行收集汇总 , 形成新的优化需求 , 同时完成新需求的分析以及页面原型的设计等 。
2、系统详细设计阶段
项目第一批次起始时间为2019年05月至2019年05月 , 项目第二批次起始时间为2020年03月至2020年03月 , 此阶段主要进行系统架构的设计 , 技术方案的选型以及系统实现方案的详细设计 , 包括各组件设计、接口规范、安全性、业务逻辑的设计等 。 提交了全链路系统详细设计说明书等文档 。
3、系统编码、测试和上线准备阶段
项目第一批次起始时间为2019年05月至2020年07月 , 项目第二批次起始时间为2020年04月至2020年06月 , 此阶段主要完成全链路系统各功能模块开发的编码、测试以及试点行上线准备工作 , 提交了全链路监控系统测试报告、上线方案、系统设置等文档 。
4、试点行上线阶段
本项目分两个批次次上线 。
第一批次:2019年7月 , 实现通过运维大屏实时监控业务系统的运营情况 , 主要包括应用和主机运行数据的收集和汇总 , 以及在科技馆的展示 。
第二批次:2020年6月 , 主要实现监控大屏功能指标完善 。 扩大监控数据及监控页面使用方式:提供监控数据查询及推送功能 , 提供监控页面嵌入功能 , 供各项目组个性化开发使用 。 完善告警相关功能 , 包括多告警源接入、告警设置、告警通知等功能 。
运营情况
目前系统已完成集团近7000余台服务器指标监控监控 , 300余个应用系统指标监控 , 实现累计51个监控指标的展示 。 用户覆盖阳光集团 , 阳光财险 , 阳光人寿以及阳光信保 , 截止发稿日期实现系统告警近1000余次 , 及时有效的避免避免异常发生 , 避免业务损失 。 对于出现异常的情况 , 系统提供详细的监控数据 , 助力运维人员快速定位并解决问题 。
项目成效
1、监控大屏一期
实现在科技馆呈现公司整体IT运营情况 , 主要展示磁盘、内存、CPU应用响应、系统评分Top5 。 如下图所示:
本文插图
图1-5 一期大屏
2、监控大屏二期
为项目组成员可以更加准确及时的了解系统的运行情况 , 提供了业务系统的整体概况和系统关键运行指标的实时数据 , 实时反映系统运行状态和异常情况 , 并增加告警管理及告警接口 , 提升公司IT整体运营能力 。 主要包含两个部分:
1)系统总览
本文插图
2)系统监控大屏
本文插图
经验总结
全链路监控平台可以帮助系统运维人员快速“问诊”并定位问题发生设施 , 进而快速解决异常 , 减少业务损失;通过大数据进行智能预警 , 避免异常发生 , 避免业务损失 。
1.聚合原有各类型数据对接方式和技术 , 形成了一套完整的多数据源统一汇总加工到输出实时展示的方案 , 为后续同类型项目提供了多类型、多数据源的大数据量实时计算及展示的解决方案及思路;
2.各设施监控数据统一采集、展示的初步使用已初见成效 , 为后续数据湖的形成以及智能化学习提供坚实的数据基础 。
3.监控数据具备标准化的输出能力 , 子公司可以快速对接并结合自己的业务特点 , 有效的提高运维能力 。
推荐阅读
- 羽度非凡|电视行业的误导:4K搭配高亮度就是不伤眼的真高清?
- 行业互联网|华为在法国成立第六家研究所,将会继续提升研发能力
- 行业互联网|大华股份与浙江高信签署战略合作协议 共建智慧交通
- 行业互联网|常程跳槽判决来了,支付525亿“违约金”!结果依然有望反转?
- 行业互联网|华为为何在法国就设立了6家研发中心?
- 行业互联网|2020走进华为西安研究所成功举办,探索“5G+云+AI”
- 行业互联网|华为 | 车载以太网物理层及TSN发展现状 与技术趋势
- 互联网乱侃秀|家里洗衣机噪音太大?这些原因你都排查了吗
- 行业互联网|移远通信携手中国移动举办5G行业终端扬帆计划闭门会
- 行业互联网|【富士康出售63万股阿里巴巴ADS,再获利1.2亿美元】
