近年来,5G、云和人工智能正加速智能社会的到来,三大技术正在重构网络。网络作为行业数字化的基础平台,是每个企业数字化转型的底座。随着网络基础设施的升级,带来更高的网络带宽和更低的网络时延,网络业务质量高…
近年来,5G、云和人工智能正加速智能社会的到来,三大技术正在重构网络。网络作为行业数字化的基础平台,是每个企业数字化转型的底座。随着网络基础设施的升级,带来更高的网络带宽和更低的网络时延,网络业务质量高要求的同时带来网络复杂度的增加,网络的日常保障和运维工作变得更加挑战,运维能力的演进成为电信网络能否持续发挥效能的关键因素。
传统人工、工具化运维已不能满足当前网络的运维需求,数据统计显示,通信网络运维问题大部分时候都是被动发现,是由用户的投诉感知,运营商本身非常缺乏预防性的网络监测和维护手段。同时,网络故障根因定位更难,日常运维有90%时间都花在问题定位方面。网络的智能化运维转型已经成为很多运营商的迫切需要。
但是,智能化在网络运维业务的工程化落地过程中,面临诸多挑战:首先,运营商网络、数据中心、企业园区等网络复杂,千差万别,需要业务分析师、AI算法开发工程师等人员参与,对相关人员的投入和技能知识要求较高;另外,针对开发不同场景的AI应用,数据建模和模型调测等工作耗时耗力,整个应用开发周期很长。为解决这些问题,构建和应用AIOps平台能力,已经成为电信行业运维智能化演进的趋势和主要方向。
在4月13日华为HAS2021 NAIE圆桌会议上,NAIE产品部首席技术官程磊跟业界分析师介绍了华为NAIE AIOps服务的规划和最新发展,以及在一些项目中的应用实践情况。
华为NAIE产品部首席技术官 程磊
华为NAIE从2019年开始正式对外发布,同时开始构筑AIOps的平台能力和服务。从2020年开始,陆续发布三批AIOps AI原子能力,编排框架和一些典型场景的智能应用,目前已经具备立体化的AIOps能力,基本满足网络运维大部分场景的智能化应用需求。
丰富的AI原子能力
NAIE AIOps服务当前能够提供超过20种AI原子能力,覆盖网络运维业务的全流程,包括故障预测、故障检测、根因诊断等。原子能力库支持常见运维业务场景需求,如流量预测、KPI异常检测、日志异常检测、CHR异常检测、异常关联分析、事件聚合、根因定位等。
同时,基于华为具备深厚的电信网络知识沉淀,结合高质量的训练样本,以及最佳算法调测和实践, 这些AI原子能力模型在保证高精度高同时,具有良好的模型泛化能力。以异常监测为例,这些检测大多都是针对通用时序数据,与业务松耦合,在使用时只需配置少量业务属性,如检测方向、周期或非周期等,算法可自动识别KPI特征,匹配最优算法,精准识别异常点。
另外,华为NAIE AIOps服务在沉淀核心AI资产自主研发的同时,对生态合作也持开放态度,支持使用者根据实际业务需求开展算法模型的创新与开发,自行扩展AIOps能力。
灵活的组合编排与DevOps能力
编排操作简单灵活,使用者可选择业务场景所需的AIOps原子能力,通过可视化方式完成流程串接,只需从组件库中拖拽数据及原子能力进行组合,即可完成应用场景端到端的图形化编排。并且,支持进行业务泛化的参数配置,包括数据接入方式、模型参数、内置电信领域泛化参数,真正支撑使用者零编码、低门槛进行作业,实现高效地构建AI应用。
同时,NAIE AIOps的编排框架还提供数据可视化服务,支持轻松按需搭建可视化大屏,其包括丰富的2D/3D可视化组件,如图表控件、地图控件、交互控件以及媒体控件等,拖拽式自由布局,快速实现DIY可视化大屏,一键预览,业务结果快速呈现,实现运维应用效果的实时可视。
另外,编排框架还集成RPA功能,只需极简的配置,即可实现数据采集和结果推送等操作,打通业务应用中的流程断点。
典型场景的AIOps APP、开箱即用
NAIE AIOps服务目前针对运维最常见的业务场景,提供10+开箱即用的APP,覆盖运营商网络、园区网络、DC网络、IT应用四大领域:
运营商网络,提供跨域故障识别分析、核心网日志异常监测、基站流量预测、无线性能分析等;
园区网络,提供园区5G设备故障监测、园区网络智能巡检、光模块故障预测等;
DC领域,提供硬盘故障预测、DC PUE优化、供电锂电故障预测、DC安全智能巡检等,
IT应用领域,提供IT应用健康监控、云服务日志异常监测等
这些应用都可以快速地实现部署和应用,同时可以提供云上或地端灵活的部署方式选择。
此次分析师大会,程磊还介绍了华为NAIE AIOps的应用实践情况,经过一年多的发展,NAIE AIOps逐渐开始进入规模应用阶段,服务已经应用于无线接入、数据通信核心网、DC等6个运维领域,应用局点超过30个,服务月调用次数已经超过4.1亿次。而且应用的效果和价值明显, 某地运营商基于NAIE AIOps服务实现的智能运维系统,在7个月应用期间,共计发现52个异常,异常指标查准率85.80%。而且多次提前发现网故障并提前预警,让运维人员及时处置,成功避免大规模的客户业务影响。
AIOps作为华为网络智能引擎的核心能力,华为在未来会继续加强投入,程磊表示,“华为NAIE AIOps服务是电信知识经验和算法能力的深度结合,运营商的运维转型和智能化是大势所趋,我们致力于打造优质的AIOps平台服务,沉淀AIOps场景最佳实践,助力运营商高效地实现智能运维。”