近日,汇付天下全新规划与设计的NOC指挥中心在公司总部大楼圆满落成!NOC即“Network Operations Center网络运营中心”,在汇付已成立一年半有余。它肩负着为汇付的所有客户提供交易、账户、资金系统稳定保障的责任,围绕“一切以客户为中心”的企业文化理念,以数字化工具和手段来实现对系统的监控、运维和技术保障。
此次全新落成的NOC指挥中心,在原有实用主义的基础上,充分挖掘了空间功能和价值,并兼具了美观度,整体以金属风格为主,选取了“数字方舟”作为设计的灵感来源,最终形成一个纯粹的数字空间。监控室整体分为三块区域,后方抬高的监控和指挥官席位构成驾驶舱,中间工作区域常驻运维专家,还有灵活的办公组成席位,可以在出现问题时临时有二线专家参与。指挥席位和工作席位形成三角形的布局,也寓意系统的稳定。NOC指挥中心建立了一套数字化的监控保障平台,以实现运行和运维数据的可观测。主屏幕主要展示汇付支付相关的核心模块功能,如核心架构产品、网络流量、安全防护,交易稳定性、核心产品交易成功率等数据,可以实时监测核心产品的波动情况。副屏幕主要展现的是与变更、告警相关的内容,用来辅助工程师对异常的提醒、判断和决策。充分利用各类监控工具,结合AIOPS理念指导,将各IAAS层和PAAS层的各类指标数字化、可视化,智能发现、定位异常。NOC工作人员以大屏和告警为主,配合自身的小屏幕实现多屏联动,协同平台实现数字化运维,来整体实现NOC指挥中心的目标:为客户提供稳定可靠的服务。
随着公司业务类型的不断丰富,系统越来越复杂,业务故障难免发生。一旦发生故障,势必对公司产生巨大影响,因此,提升对故障的定位能力、处理能力及恢复能力,成为生产工作中最核心的目标。随着公司业务进入数字化转型升级之中,同步完成数字化安全生产体系的建设,也显得尤为重要。
汇付的NOC指挥中心主要负责全局性应急决策与指挥,对各业务提供及时准确的告警、生产故障的全生命周期管理、重大故障时的快速切换以及线上问题的升级支持,以有效缩短系统故障时长和提升用户体验。具体来说,它具备如下几方面能力:
1)完善的监控能力。NOC监控体系包含IAAS、PAAS和SAAS的全方位监控,各类监控数据可通过可视化和自动化报警,能及时发现和快速定位问题。
2)应急处理能力。设立NOC指挥中心后,监控大屏会实时展示基础架构和业务数据,通过多维度监控分析系统稳定性。
3)建立指挥官应急机制,结合OnCall值班制度,可7*24小时应对异常突发情况。在异常发生后第一时间组建应急处置小组介进行处理,并及时发布故障处置过程和进展情况。
4)不断完善的应急预案,提升了NOC的应急切换能力。通过切换、降级、熔断等各类手段进行故障快速恢复,缩短MTTR时长。
5)重大业务和活动保障能力。NOC中心具备活动报备机制,能提前进行容量评估与投入,确保生产活动安全稳定,并针对业务特点配置定制化的监控大盘和进行报警。
接下来,通过NOC中心提供的能力建设,将有效提高公司应对故障的处置效率,确保系统稳定性,最大程度地预防和减少故障时长和损失,保障业务连续性,促进业务发展。NOC团队也将对生产故障从被动应付型向主动保障型、从传统经验型向高新技术型转变,促进汇付应急体系健全发展、技术创新和迭代并行,全面提升故障应急管理水平。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com