青丘有奇鸟,自言独见尔;本为迷者生,不以喻君子。 ——陶渊明《读山海经十三首·其十二》
燕鸥每年往返于北极和南极,行程达36000公里,却能做到飞行路径毫厘不差,准确辨别方向。这种长距离的导航和定位能力,是非常罕见的,也使得燕鸥被誉为动物界的“飞行冠军”。
在浙商银行燕鸥系统建设过程中,燕鸥的感知分析和导航定位能力也为浙商银行提供了重要参考。为此,浙商银行携手华为,立足数智浙银技术底座建设情况,以iMaster NCE-Fabric网络数字地图为基础,构筑起以数字孪生、网络建模为基础的动态网络地图技术底座,实现燕鸥数据中心智能导航定位系统建设。
打造数智浙银运维底座
全面推进数字化转型
浙商银行是十二家全国性股份制商业银行之一,于2004年8月18日正式开业,总部位于浙江杭州,是我国第13家“A+H”上市银行。在“2022年全球银行1000强”榜单中,该行以一级资本位列第79位。
浙商银行以“一流的商业银行”愿景为引领,高举“科技兴行”大旗,以数字化改革为主线,确立了“185N”体系架构。这一架构包括构建“数智大脑”,汇聚“数智零售、数智企服、数智投行、数智资管、数智跨境、数智监督、数智运营、数智管理”等8大系统,并围绕个人、企业、政府、同业、员工及家属等5大客群,形成N项“管用实用、真实可感”的重大应用,以打造具有辨识度、影响力的标志性成果,全面开启“数智浙银”的新篇章。
客户网络运维数字化转型面临新挑战
打造数智浙银运维底座,关键在于运维数据的数字化呈现和靶点快速定位。随着数字化转型的逐步深入,银行数据中心网络运维已进入数字化改革的深水区,浙商银行结合实际运维过程中遇到的困难,认为单一的数字化工具已完全无法满足数据中心的立体需求,具体表现在以下几个方面:
一是传统的静态网络拓扑已经无法全面呈现运维所需的数据。网络拓扑作为数据中心的“骨架”,无论是前期的规划设计和工程实施,还是后期的运维管理,都依赖于网络拓扑。然而,传统的网络拓扑是一张静态的二维图片,它承载的信息比较单一、片面,无法实时更新。此外,网络信息局限于二维平面,这限制了运维人员的效率。新一代的网络拓扑应该能超越二维平面的束缚,既能展现三维立体空间信息,即网络上面承载的数据流量和应用系统;也能输出四维时间尺度信息,可以提供最新的实时数据,也能追溯历史。网络拓扑要实现从静至动的转变,让数据中心的数据动起来,活起来。
二是故障处置的实时性要求极高。来自于主管单位和业务连续性的双重压力对运维人员的故障处置效率提出了更高的要求:一方面,主管部门高度重视商业银行业务连续性保障工作,并明确规定由于重要信息系统服务异常,在业务服务时段导致银行业金融机构两个(含)以上省(自治区、直辖市)业务无法正常开展达半个小时,就属于重大生产事件;另一方面,浙商银行致力于为客户提供流畅、实时、不间断的金融服务,持续提升用户体验。为此,浙商银行制定了“136”的快速响应目标:即1分钟发现问题,3分钟定位问题,6分钟处置问题,实现10分钟内快速解决问题。
三是前端应用的高速迭代需要网络运维人员的敏捷响应。为了应对浙商用户的个性化、差异化金融服务需求,前端应用高速迭代。随之而来的是业务系统架构的不断革新。网络人员也需要随之进行敏捷响应:及时评估网络、系统变更对业务的实时影响,以便高效决策变更窗口、变更时技术保障强度、变更后关联业务验证等。传统的运维模式无法快速厘清基础设施和上层业务的对应关系,导致运维人员对变更产生的业务影响评估不充分、不完整,甚至是产生错误的决策。为更好地保障生产和维持稳定运行,“以业务为视角”的管理目标已经成为运维人员必须面对的课题。
燕鸥系统应运而生
燕鸥每年往返于北极和南极之间,行程36000公里,却能做到飞行路径毫厘不差,准确辨别方向。这种长距离的导航和定位能力是非常罕见的,也使得燕鸥被誉为动物界的“飞行冠军”。
浙商银行燕鸥系统建设的灵感来源于燕鸥的感知分析和导航定位能力。这个系统的目标也是希望能够像燕鸥一样,俯瞰所有IT系统的运行情况,智能分析全局。同时,也能动态感知细节,层层穿透,精准查找并发现某一环节的具体问题,直到最终定位根因。
燕鸥的导航和定位能力对于浙商银行燕鸥系统建设来说,是一个非常有价值的参考。通过借鉴燕鸥的这种能力,浙商银行希望能够建立一个更加高效、智能的系统,以便更好地管理银行的所有IT系统。
在浙商银行燕鸥系统建设的过程中,燕鸥的感知分析和导航定位能力不仅为银行提供了灵感,也为银行提供了重要的参考。通过借鉴这种能力,银行可以更好地实现其业务目标,提高工作效率和准确性。
燕鸥系统目标架构
浙商银行成立燕鸥项目专班,联合华为,立足数智浙银技术底座建设情况,以iMasterNCE-Fabric网络数字地图为基础,结合浙商银行实际运维需求,实现技术创新:构筑了以数字孪生、网络建模为基础的动态网络地图技术底座,实现燕鸥数据中心智能导航定位系统的建设。
图示为浙商银行燕鸥系统的总体架构
在现代化数据中心中,存在多种品牌和型号的异构设备。同时,多种技术形态共存,包括传统网络、SDN网络和云化网络。此外,多个运维工具并用,例如告警平台、CMDB和NPM等等。面对丰富多样的生态现状,燕鸥系统需要全面对接全行的所有运维平台,兼容各种设备及平台接口,通过不同协议和方式采集各类数据。例如在面对如何解析应用之间的访问关系时,除了传统的NPM提供数据源外,浙商银行还通过行内自建平台自动采集全网TCP连接表以补充数据源,通过约定格式输出给燕鸥平台。燕鸥平台对输入平台的网络元素进行数字建模,输出的能力主要涵盖物理拓扑、应用拓扑、应用网络互视、导航定位和路况五个方面。并向其他系统提供开放服务,实现多层次全方位的有机结合,深度挖掘数据中心的运维潜力。根据行内的运维发展需要,燕鸥可以持续提供更加丰富和个性化的业务运维能力,实现数据中心ICT基础设施全要素的覆盖,为金融网络服务化能力的建设打下坚实的技术基础。
燕鸥系统成果与应用
浙商银行燕鸥专班结合长期运维工作中遇到的痛点、挑战,在燕鸥系统产品构思过程中提出大量极具价值的实际产品功能需求,在实际开发过程中,提供专家级运维算法支持,联合华为强大的研发团队,实现了燕鸥系统功能的逐步落地:一是打造应用朋友圈,展示单应用的服务器分布,以及单应用对应的网络拓扑,完整呈现应用意图,便于从全局视角查看应用社交关系,实现应用和网络的灵活联动;二是梳理外部单位专线与行内应用的对应关系,实现专线的精细化运营;三是开放集成,燕鸥系统与行内罗盘系统对接,从客户交易、业务、应用,到最终的物理链路,实现客户旅程的全链路跟随。
此外,浙商银行联合华为专业服务团队,在拓扑呈现、开放对接等方面进行优化定制,实现燕鸥系统的快速敏捷迭代。
燕鸥系统在浙商银行已初见成效。
全网一图呈现
通过大数据AI采集分析,利用大数据治理的手段,关联生成一张动态的网络数字地图:一级展示数据中心分布、二级展示数据中心内区域间拓扑、三级展示单区域详细的拓扑互联关系,展示互联线路丢包率、带宽利用率等实时数据,精准评估线路质量。多厂家、多类型、多协议网元覆盖,动态更新。同时交换机下联的服务器以及服务器内的虚拟机分布也得以在网络拓扑上直观呈现。一张图穿透浙商银行的所有ICT资源整体架构,解决了网络数据一体化、可视化的问题。
路径一键导航
对于网络拓扑中任意两个端点,燕鸥系统里可一键展示中间经过的所有节点,包括网络设备、安全设备、负载均衡等等。同时,还可以看到路径上面的流量是否拥塞、是否存在丢包。在发生故障时,可以实现问题的精准定界,还可以进行根因分析。
应用网络互视
除网络拓扑外,燕鸥系统还可以展示应用拓扑,并能够建立两张拓扑之间的联系:呈现应用所关联的服务器及其对应的物理设备拓扑连线关系、展示应用朋友圈和应用与应用之间互访关系。通过燕鸥系统,贯穿了整个业务逻辑,更系统、更直观地展现了从交易到ICT基础设施的信息关联。
在未来,浙商银行与华为将继续深度合作,结合华为L4数据中心自动驾驶网络方案,依托网络数字地图底座,借助专业服务敏捷定制,融合浙商银行自身在金融行业的运维经验,围绕燕鸥系统持续创新。继续落地专线精细运营、告警画像分析、故障注入模拟等高阶特性,与行内罗盘系统对齐形成双剑合璧,构建交易全链路跟随,实现故障快速发现、精准定位的目标,切实提高应急快速响应能力,全面提升科技运维水平。最终实现打造数智浙银,达成“185N”的战略目标,共同推进金融行业运维数字化转型。
全部0条评论
快来发表一下你的评论吧 !