*** 摘要: ***
研究一种代替人工定位LTE外部干扰的工具,通过AI算法和自动化技术,将外部干扰源呈现在地图上。它利用2 400维PRB数据,生成小区的干扰瀑布图;用AI算法判断干扰种类,筛选外部干扰小区;最后利用小区的MR大数据,将表示小区受干扰程度的PHR用热力图的形式呈现在地图上,指导优化人员对外部干扰源进行精准定位,快速排除。
01
概述
移动网络的发展日新月异,但仍可能会遇到如下问题:接续困难、通话质量差、上网慢、下载龟速、流媒体卡顿、视频聊天不流畅、用户投诉信号满格但无法正常做业务。这一切都可能是由干扰造成的,干扰带来的各种各样问题,会使用户降低对网络的满意度,而干扰排查一直以来都在困扰着网络优化人员。
目前排查干扰的传统手段是依靠工程师的经验,首先利用网管结合地图初步判断干扰源的大概位置,然后再利用频谱仪+定向天线现场逐一扫频。传统方法存在4个方面的缺点,首先是及时性差,部分干扰靠人工观察网管指标难以发现,通常造成用户投诉后才会引起注意,缺乏主动发现全网问题的手段;其次是准确率低,由于干扰形成的原因往往很复杂,对工程师的要求很高,但工程师的水平参差不齐;第三是效率低下,干扰排查需要分区域、分小区进行逐一分析,耗费大量时间;最后是人工成本高,尤其是对外界干扰的排查,一个干扰源往往需要多人、多次现场逐一查找,人力物力耗费巨大。
本文提出的方案分为两大模块:外部干扰小区识别模块和外部干扰源定位模块。项目的总体思路是,首先通过机器学习建立一个多分类的模型,把需要分类的小区信息输入模型后,模型自动对小区干扰情况进行分类。通过模型可以输出多种结果,包括正常小区、内部干扰小区和外部干扰小区。最后提取出对网络质量影响最大的外部干扰小区,使用其MR数据,对外部干扰源进行定位(见图1)。
图1 项目方案图
02
LTE干扰智能定位方案
2.1 外部干扰源识别模块
2.1.1 获取训练样本
从网管上提取每个小区的24 h粒度的每个PRB上的干扰值,整理相关数据,包括小区名称、eNodeB ID、CI、时间戳、PRB号和干扰电平。然后,把相同带宽的小区放置在一组,剔除因设备故障、夜间自动关停等造成小区信息不完整的数据,将其作为训练数据(见图2)。
图2 生成训练数据示意图
有了训练数据后,还需要人工介入,分类打标签,但为上万个小区打标签耗时巨大,为了提升效率,采用了干扰瀑布图加聚类算法进行预归类的方式来加速处理。
生成干扰瀑布图:以时间为横轴,以0—99号PRB为纵轴,每小时每个PRB对应的干扰均值根据干扰强度,分别用不同的颜色来表示,最终生成每个小区的干扰瀑布图,辅助人工打标签(见图3)。
图3 干扰瀑布图
聚类加速:为进一步提高人工打标签的效率,先利用机器学习中的聚类算法,对所有干扰瀑布图进行聚类,再对聚类的结果进行人工确认,得到最终训练样本的标签,从而获得完整的训练样本(见图4)。
图4 生成训练样本示意图
利用瀑布图加聚类的方法,可以大幅缩短人工打标签的时长,由每百个小区100 min降低到10 min,效率提升10倍。
2.1.2 建立预测模型
有了完整的训练样本,就可以进行多分类的建模。在建模过程中遇到并解决了如下问题:
a)训练时间过长。因为采用的数据是24 h乘以100个PRB,共多达2 400列,因此训练时间过长,使用PCA降维,由2 400列降到83列,训练时间由分钟级别降到秒级别。
b)异常小区占比少。总体上干扰小区占比较少,易造成模型不准确,因此采用过采样的方法解决,异常小区占比由3.49%提高到9.39%,最终指标也提高了1.4个百分点。
c)分类指标不理想。从一开始的六分类,f1指标仅有0.62左右,从网络实际需求出发,将模型分类降低到三分类,f1指标提升至0.8以上。
d)调参效率低。使用贝叶斯调参代替网格搜索,调参效率提高10倍以上。
在经过模型的多次优化后,各种模型指标均达到较为理想水平,尤其是极端森林、xgboost、lightgbm表现最好,因此,使用这3种模型进行堆叠,在15 000多个训练样本情况下,准确率达到0.98,f1达到0.869 4,模型结果可用。至此,完成了干扰精准识别与自动分类模型的建立(见图5和表1)。
图5 各模型效果图
表1 堆叠后模型效果
2.2 外部干扰源定位模块
模型建立完成后,即可识别出全网外部干扰小区,接下来需要通过MR数据来定位干扰源位置。MR,即测量报告,是评估无线环境质量的主要依据之一。从北向接口中提取的MRO文件包含了60余项数据,可以有效解析的主要无线类数据有14项,从中选取5项,包括小区标识、经度、纬度、接收电平和发射功率余量。
其中PHR也就是发射功率余量,反映UE的发射信号功率大小,是反映小区内UE发射功率分布情况的主要指标(见表2)。PHR取值范围为063,值越大,表示手机的功率余量越多,手机的发射功率越低,反之越高。本课题需要定位干扰源位置,因此需要从原始MR中筛选出PHR值在022、手机实际发射功率不正常的采样点,同时剔除RSRP<-110 dBm的点,避免因为弱覆盖造成PHR变差的情况,影响判断结果。
表2 PHR取值对应表
用这些包含经纬度的采样点,生成热力图,经过对经纬度纠偏之后,通过Python的Pyecharts模块,将PHR以热力图的形式呈现在地图上(见图6),图6中红色区域表示PHR异常的区域,更接近于干扰源的位置。
图6 外部干扰源定位模块示意图
2.3 对外界干扰小区的干扰源进行自动定位
本节以某村周边突发强干扰为例进行说明。该强干扰影响3个基站9个小区,该区域为大型居民区,且北面是海,东边是山,地形较为复杂,如7图所示。
图7 干扰源影响区域
提取3个基站的24 h的MR数据,提取PHR信息,经过经纬度纠偏之后,呈现在百度地图上(见图8),可以看到,数据异常区域主要集中在4个区域,为重点排查区域。
图8 干扰智能定位工具定位出的干扰源大致区域
通过与无线电管理委员会的合作,对以上4个区域按照顺序定点排查,迅速定位到干扰源位于区域2一栋居民楼内,用户为了解决深度覆盖问题自行安装的手机信号放大器。通过开发的工具可以有效缩小排查范围,协助现场工程师迅速定位干扰源。
03
结束语
本文通过对网管KPI的大数据分析,利用机器学习建模,自动识别出所有存在干扰的小区并进行自动分类,准确率超过85%,弥补了目前优化工作中对干扰类型判断方式的匮乏,为进一步的深入干扰排查指定目标。对于影响最大的外部干扰小区,通过MR进行干扰源的智能定位,创新使用Python加百度地图的方式,将PHR以热力图的形式清楚地呈现在地图上,帮助缩小干扰源排查范围,极大地缩短了定位时长,提高了工作效率。
目前已完成建模和全省4G栅格速率的全流程自动预测,用于指导全省4G网络低速率区域的整改,提高用户感知。
与排查干扰的传统手段相比,该工具主要有如下3个方面的优势。
a)发现问题全面,告别传统使用全网统一门限值的粗略判断方式,通过2 400个维度的数据,自动甄别全网干扰小区,尤其是对隐性干扰小区,可以达到精准全面的识别。
b)提升工作效率,对发现的干扰问题自动进行干扰类型的分类,区分内部干扰与外部干扰,相对于传统人工判断方式,效率极大提升,全网运行一次仅需1 h。
c)增强自主优化能力,对于外界干扰可以自动输出重点排查范围,大大节省人力物力,增强自主优化能力。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !