【2019IT运维十大样板工程】山西省农村信用社联合社业务运维指标可视化建设项目

2019-10-17    来源:IT运维网

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

山西省农村信用社联合社(以下简称省联社)是由省委、省政府直接领导和管理的地方性金融机构,于2005年8月正式挂牌成立。
 

服务覆盖面最全。目前,共有省、市、县、乡四级机构3182个,是全省唯一一家服务范围覆盖到各县(市、区)、乡(镇)、村的金融机构。
 

业务规模最大。截至2018年末,全省农村信用社资产总额达到11427亿元。资产总额、存贷款余额均居全省金融机构之首。
 

支农支小力度最强。截至2018年末,涉农贷款余额达3944亿元,占全省银行业金融机构的40%左右。连续多年实现了“三个不低于”目标和监管要求。

 

面临的运维挑战
 

随着省联社业务的不断发展,信息系统的持续建设以及不断完善,信息系统变得越来越庞大、复杂,业务对于信息系统的依赖越来越高,信息系统的安全运转已经成为保证省联社业务有效性与连贯性的关键。
 

当前运维主要面临三大挑战:
 

1.被动告知故障,传统方式排障困难繁琐。
 

查日志,时间较长;经验判断,难度较高且依赖专家;开发专用监控工具,周期长,每次也只能针对一套系统。
 

2.领导急需一份某某数据报告,缺少实时业务数据,报告只能做到“T+1”。
 

3.监控大屏不够灵活,无法满足各种场景(双11、重保)来快速调整。
 

所以,建设完善的可视化监控系统、建立生产系统的故障发现与IT运维预警机制、提高对生产系统故障的及时发现以及快速排障能力,对保证省联社信息系统稳定运行和业务持续发展具有重大意义。

 

项目方案建设
 

1.建设目标
 

通过建设业务运维指标可视化项目,实现以下(不限于以下)目标:
 

(1)对省联社关键系统的业务逻辑梳理,提升应用运维水平;

(2)实现智能的告警模拟和多维度复合告警能力,全面掌握业务运行状态;

(3)构建省联社关键业务系统的业务性能监控视图,直观地反映面向业务的实时性能管理;

(4)具备或定制开发,能够符合第三方平台标准的各类指标推送功能;

(5)可以针对各种场景提供快速展示视图的定制。
 

2.技术方案
 

本解决方案基于先进的协议解码技术,充分利用可靠的网络数据资源,帮助省联社信息科技部门建立业务运维指标可视化系统。以业务服务为中心,围绕服务路径图,提供交易量、成功率、响应时间、响应率、返回码五大关键指标,并区分交易类型(比如转账、查询)、交易渠道(比如柜面、网上银行)或自定义的统计维度,展现业务服务组件的运行状态。实现了业务可用性、性能、负载量的全面指标可视化。同时,能直接查询全量的交易明细报文,实现单笔交易级别的监控与管理。
 

业务运维指标可视化系统整体架构由数据采集层和数据处理层二个层次构成,其原理是由业务运维指标可视化系统服务器网卡直接抓包,实时输出数据;解码引擎对业务数据包进行实时解码,并且解码引擎可灵活配置;可以自动发现节点之间的连接关系,为业务路径配置提供信息;最后,由上层交易监控系统服务和呈现层进行交易性能指标监控、统计输出、追踪和告警。其产生有价值的实时业务数据和运维数据均可通过RestfulAPI与其他系统或平台进一步对接,直接产生业务和管控效益,如风控、清算大屏、精准营销等。
 


3.实施部署
 

业务运维指标可视化系统的物理架构,采用三层架构设计,支持多个数据中心的分布式部署;底层通过交换机镜像获取业务数据包;然后接入中间层的Tap设备,通过Tap对流量进行汇聚和过滤,以得到更加精确的业务数据;最终业务数据进入业务运维指标可视化系统进行抓包、解码和呈现。
 


业务运维指标可视化系统在山西农信的具体物理部署图
 

省联社在主数据中心部署了2台业务运维指标可视化系统服务器,通过TAP设备接入外联区和服务器一区的流量。2台系统服务器采用了主从架构,分别进行数据包捕获、解码,统一由主系统来进行集中管理和分析呈现。
 

同时通过使用服务路径发现模块进行业务访问逻辑梳理,接着通过在图形化界面中用鼠标拖拽方式即可完成服务路径图的定义,快速构建从渠道/外联,经过前置/ESB,到业务应用系统,最后到核心系统/数据库的整个业务访问路径,真正实现了端到端的业务运维指标可视化。

 

项目总结
 

1.项目成果
 

目前,省联社业务运维指标可视化系统共建设监控了17套重要业务系统,包括行内最重要的核心业务系统、ESB系统、农信银、支付系统等,都在监控界面进行实时监控。
 


实现对各种场景快速构建监控视图
 


我社实现了多场景化的告警策略及灵活的告警配置为业务系统提供实时预警
 


创新性地实现交易颗粒度的网络指标及与业务指标相关性分析
 



 

同时,省联社将系统解析的业务数据通过实时高速的接口输出给风控系统,匹配风险规则模型,进行资金风险实时分析,判断交易风险性,同时进行风险性分析、呈现、搜索,为业务部门提供单笔交易的风险可视化;也为后期运维自动化和运维大数据提供底层数据支撑。
 


通过业务运维指标可视化系统,省联社达成如下成果:
 

(1)更清楚的梳理了业务逻辑关系,提升运维排障效率;

(2)复合网络和业务指标,全面掌握业务系统运行状态;

(3)业务追溯由T+1转为T+0,来服务于人行系统监管数据排查;

(4)对业务周期变化进行预警,更好地分配计算资源;

(5)对业务数据进行旁路输出,探索由运维向运营转变,比如风险防控,清算大屏、精准营销。


点评:业务运维的可视化为金融体系日益复杂庞大的IT系统信息化管理带来了便利,山西省农村信用社联合社业务运维指标可视化建设项目基于先进的协议解码技术,提高了对生产系统故障的及时发现以及快速排障能力,保证了信息系统的稳定运行和业务的持续发展。

标签: 运维 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:思科发布“ IT 运营就绪性指数”预测: 更多CIO愿意采用分析和自动化技术,IT 运营的方式

下一篇:如何做好数据中心机房运维?