华为陆海鸥:从被动响应到主动治理,AI加速FBB网络运维转型

​随着5G、物联网、政企专线、超高清视频、智能家居等业务发展,不论是光纤网络、IP网络还是家庭Wi-Fi等FBB(固定超宽带)网络,都遇到越来越复杂的运维。如果电信运营商的网络能够像自动驾驶汽车一样,自动运行和维护,对运营商经营发展将是极好的事。

“自动驾驶网络的终极目标是实现网络自愈,而实现网络自愈的前提是能够对网络故障的精准预测,实时感知、快速诊断和快速恢复。”在12月11日华为共赢未来全球线上峰会(BWS,Better World Summit)上,华为NCE产品部总裁陆海鸥强调了主动化、智能化运维的重要性。

当前人工智能AI技术,正赋能千行百业。在电信领域,基于AI的智能网络分析,被认为可以加速FBB网络自动驾驶。那么,AI到底如何助力运营商运维转型?如何将AI技术,系统应用到自动驾驶网络,实现“分钟级故障感知-诊断-修复”?

智能时代,联接产业迎来五大变化

行业普遍认为,未来十年将是智能时代蓬勃发展的黄金十年。当人类迈进万物互联、万物感知、万物智能的智能时代,人们的生活方式、工作方式将发生翻天覆地的变化。作为万物互联基础的网络,同样发生着改变。

对此,陆海鸥表示,网络联接产业正发生令人期待的五大变化。

变化一,连接对象更多样。网络除了传统维度连接人和家庭外,还将连接海量的智能终端及行业智能体。

变化二:网络通过5G、Wi-Fi 6、光纤等接入技术,将提供“泛在千兆”的连接服务能力。

变化三:连接场景多元化。一方面,家庭网络从服务信息娱乐走向教育和办公;另一方面,企业网络从服务办公走向生产。

变化四:应用对连接的需求更加精细。网络服务将从尽力而为,向差异化服务和确定性保障演进。

变化五:网络运维及管理将走向超自动化。

在上述五大变化中,第五个变化得到各方认可。据Gartner发布的十大战略趋势报告显示,网络自动化将是不可逆转,不可避免的趋势。

实际上,我们可以预知,AI技术将成为上述变化过程实现的重要催化剂。在陆海鸥看来,通过引入大数据和AI,运营商网络将进一步提升系统自动化水平,大幅降低运维复杂度。

AI对FBB网络带来的改变包括三方面。陆海鸥介绍,一是AI让网络感知从模糊到精细,从非实时到实时,实现网络全景可视;二是通过数据分析和特征挖掘,AI让趋势可预测,让根因可学习;三是通过自主化场景决策,AI让故障可自愈,使网络运维从被动响应变为主动治理。

网元、网络、云端全面引入AI,打造故障“0-1-3-5”运维方案

AI是网络自动化的催化剂,得到大量运营商的认可。我们也看到,包括中国三大运营商在内的全球领先运营商,都在致力于将AI引入到网络管理运维中。

那电信运营商该如何更好地引入AI?对此,陆海鸥介绍了华为的理解,华为认为,业界可以构建云端、网络、设备三层AI架构,系统地在网元、网络及云端引入AI能力。

第一,在网元层,华为通过轻量级的AI推理框架,增强网络体验数据的实时感知能力,结合场景特征,提供网元级短周期的感知分析和预测诊断能力。

第二,在网络层,华为iMaster NCE基于网元存量数据、配置数据、网络性能和告警数据、网络操作日志等网络数据的采集、存储、分析,将物理网络数字化映射到数字孪生中,打造一张全景可视的网络高清地图。

在此基础上,通过iMaster NCE内置的网络级AI推理框架,将华为30多年积累的通信领域经验,融入到通用AI算法,开发出“资源预测、网络KPI检测、故障归纳、异常根因确认”等四大类网络领域AI算法,使能FBB网络闭环自治。

第三,在云端,针对AI模型普遍面临的算法老化及泛化问题,华为通过云端智能服务平台,提供数据、模型训练和更新服务。通过云地协同模式,支持网络领域AI算法的开发、集成与更新迭代,让算法越用越聪明,越用越精准。

以终为始可以少走弯路。运营商打造自动驾驶FBB网络,是为了实现网络自愈,而实现网络自愈就必须能够对网络故障进行精准预测,还要能实时感知、快速诊断和快速恢复。这就需要产业界推出创新的工具。

为此,华为推出iMaster NCE,面向运维场景与云端NAIE及跨域智能运维AUTIN集成,共同实现故障“0-1-3-5”运维方案:故障提前预测,1分钟故障感知,3分钟故障诊断,5分钟故障修复。

华为陆海鸥:从被动响应到主动治理,AI加速FBB网络运维转型

陆海鸥进一步解释道,iMaster NCE通过从网络设备实时采集设备告警,网络KPI、业务SLA等多维数据,实时分析感知网络异常,输出故障incident;通过智能诊断,给出网络异常根因和修复建议。对于配置类故障,可通过控制器和管理器,自动完成网络和业务的调整,实现网络故障分钟级自动闭环。

此外,iMaster NCE基于长周期故障特征学习,对光纤亚健康、网络资源耗尽等潜在风险提前预测网络异常。

故障“0-1-3-5”,运维方案的典型应用场景

传送网络、IP网络、家宽网络等不同网络,对AI的网络感知分析及预测诊断的具体需求不同。华为在不同网络及业务场景中,是如何构建故障“0-1-3-5”方案呢?

对此,陆海鸥介绍了华为故障“0-1-3-5”运维方案的精准预测、实时感知、智能诊断、智能修复四大典型场景以及实践效果。

场景一:光纤网络亚健康预测

光纤的可靠性与性能是通信网络的基础,一根光纤往往承载着大量的用户业务。光纤故障除了工程施工、自然灾害等突发因素外,光纤持续劣化造成的性能故障,则是行业老大难问题。

华为作为全球最大的光网提供商,可结合不同地域网络数据,使得其对光纤线路劣化特征学习更全面。基于全球网络的统计特征、信号特征、模型特征等,华为提取了10多种典型数据特征,综合运用5种模型聚合,通过集成学习算法,将预测精度从单模型的80%提升到90%。

此外,在兼顾数据采集精度和带宽成本问题上,华为创新引入网元、网络两层分析能力,比如在网元上,对400多个光参实时采集,通过智能压缩等技术,在不损伤数据措施的前提下,实现上报数据1:60压缩比。

陆海鸥还介绍到,今年华为iMaster NCE光纤亚健康预测方案,在江苏联通试点时,两个月时间内成功预测到一条OCH路径亚健康和两根光纤严重裂化,最后结果均证明检测十分准确。

场景二:IP网络故障实时感知

IP网络故障定位难度非常大。此前发生一个真实案例,某电信运营商遭遇了一次IP承载网故障。当时该运营商与伙伴累计投入10余位运维专家,历时10小时,最终才定位了故障原因,是某IP端口转发异常。

对IP网络故障定位时长的问题,华为从三个维度发力,提升IP网络故障实时感知能力,即IP设备实时感知能力、业务级SLA感知能力,及网络健康感知能力。

具体而言,一是在IP设备实时感知能力方面,华为IP设备支持iFIT检测能力,再结合设备级AI能力,可实时感知到基站每条业务流及海量网元指标的异常。

二是在业务级SLA感知能力方面,iMaster NCE通过对时间和空间的聚类分析,识别出质差业务的公共路径,并选取严重质差业务流,自动启动逐跳检测,分钟级即可找到故障点。

三是在网络健康感知能力方面,iMaster NCE基于对六大类共八万多网络指标的实时分析,使用神经网络、动态阈值异常识别技术,可以识别出90%的网络亚健康。

效果如何?据陆海鸥介绍,北京联通IP移动承载网,通过部署iMaster NCE移动承载网络智能分析方案,实现分钟级群障定位,运维效率提升30%。

场景三:5G承载网故障根因精准识别

众所周知,日常运维中基于设备告警的故障诊断仍是主要处理手段。以5G承载网为例,中国移动典型的一个地市网络,每天的设备告警数量多达几万条。大部分一线维护人员只能处理重点设备告警和紧急投诉;每日可处理工单上限在几百个以内。而目前普遍采用静态专家经验的工单处理,容易漏报、错报,且提供的故障定位信息不明确,导致无效上站和无效工单多。

华为iMaster NCE如何去除网络运维噪声、精准识别故障点?对此,陆海鸥在峰会上介绍到,华为iMaster NCE通过三步实现故障智能诊断。首先,降噪过滤。根据专家经验和告警规则,对海量告警进行筛查,过滤掉80%以上的无效告警;其次,关联聚合。通过时间、Topo等多个维度数据,对告警进行整合;最后,通过层次聚类算法,将分散告警信息,聚合成多组故障类别。

据陆海鸥介绍,iMaster NCE通过机器学习和人工神经网络算法,可识别每个具体场景及根因告警,给出维护建议,可有效指导工单系统精准派单。

比如,郑州移动通过部署iMaster NCE智能incident管理方案,压缩了99.8%的无效告警,承载网相关的每日故障派单数量,从600余单下降到400单左右。

场景四:家庭网络的智能修复

全球疫情持续发展,在线办公、在线教育成为新刚需,家庭网络的重要性进一步凸显。据统计,过去10个月家庭网络流量增长70%,家宽问题投诉量也同步增加,其中60%的投诉问题集中在家庭侧,且多数与Wi-Fi相关。对于家庭网络类问题,运营商往往通过安排人员上门维修解决,上门维修一直存在成本高、预约难等问题。

对此,陆海鸥介绍,影响Wi-Fi体验的问题主要有两类:干扰、漫游、配置类问题,以及设备、连接类问题。

对于第一类问题,通过NCE云端调优方案,可自动化修复:NCE从AP采集网络KPI数据,识别出该终端设备特征和漫游能力。然后通过大数据分析该终端7*24小时历史漫游行为,生成该终端的最佳漫游调优策略,下发到网关引导终端漫游,使得Wi-Fi信号平滑切换。

对于第二类问题,NCE自动分析根因,并将分析结果推送到网关,用户连上Wi-Fi时就会自动弹出Portal,提示问题原因和修复建议,指导用户自助排障。

据悉,在家庭网络场景应用云端优化和自助排障功能,预计平均可减少约10%上门。

笔者观察:AI技术把简单留给运营商

将AI引入到FBB网络中,提高网络运维效率和降低成本,是运营商渴求的方向。这种需求要实现不容易,所以对产业既是机遇也是挑战。

我们看到,通过引入云端、网络、设备三层AI架构,基于iMaster NCE、云端NAIE、跨域智能运维AUTIN实现的故障“0-1-3-5”方案,华为在光网、IP网络、家庭网络维护中取得初步成效。

该方案贯彻了华为的一个理念,就是“把简单留给客户,把复杂留给自己”。目前全球运营商市场已累计部署iMaster NCE 1800多套,其中管控器一体化部署约300套。

正如陆海鸥所说:“无论是网络演进还是新建网络,华为建议运营商部署iMaster NCE管控器一体目标方案,增强网络智能分析能力,逐步构建故障‘0-1-3-5’能力,实现运维转型。”

在未来FBB网络运维愈加复杂的明天,运营商将更加重视网络智能分析,加速网络自动化、智能化进程。可以看到,自动驾驶FBB网络时代,正在到来。

作者:黄海峰

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )