基于运营商用户数据特征实现大气污染防控部署研究

电子说

1.3w人已加入

描述

  来源:邮电威廉希尔官方网站 , 作者:晁昆, 高洁, 贾玉玮 ,徐乐西 ,程新洲 ,成晨

引言

2017年10月,党的十九大报告指出,污染防治攻坚战是这一时期的“三大战役”之一。2017年12月,中央经济工作会议指出,打好污染防治攻坚战,重点是打赢蓝天保卫战。2018年3月,政府工作报告再次强调坚决打好三大攻坚战,推进污染防治取得更大成效,巩固蓝天保卫战成果,携手行动,建设天蓝、地绿、水清的美丽中国。

近几年,空气质量、大气污染已成为社会各界广泛关注的问题,一些研究机构、大型企业以及创业公司都纷纷瞄准了这一领域,投入大量人力物力开展研究并推出了相关产品。如一些大型研究机构利用大数据分析优势,融合物联网技术,提供高精度空气质量预报,实时监测城市区域的污染物来源和分布状况;阿里云以“蔚蓝地图”APP为载体,使用户可查询和分享城市及大气污染源的实时监测数据;此外,一些创新企业的精细化PM2.5检测以及面向公众的空气检测设备也引发大量关注,但现有产品多集中于空气质量的实时监测和高精度预报,缺乏和环保数据、社会公众数据的深度融合,导致产品无法有针对性地、定制化地评估大气污染对社会、企业及公众影响,不能精准触达到个人。

根据行业及产品调研分析,本文将基于运营商用户数据特征,结合大气环境、空气质量数据,进行大气污染防控领域的方案研究,并探讨其应用场景。

1 运营商用户数据特征

移动互联网的快速发展促进了信息和数据呈爆炸式增长,作为承载的移动互联网的核心,运营商具备先天的数据优势,相比于BAT等互联网公司和第三方评测公司,运营商的数据具备覆盖全面性以及统计完备性等优势;相比于终端公司,则有更多更合理的数据采集便利。运营商数据主要包括运营支撑系统(OSS)域数据以及业务支撑系统(BSS)域数据。OSS域主要是网络相关的数据,比如基站的基础信息数据、地图图层及道路数据、移动网络实时话统数据、移动用户的XDR业务记录数据等;BSS域数据包含用户身份信息的用户基本信息表、用户每月出账账单、用户语音业务和数据业务详单等。

从用户的维度来看,运营商数据包含了人的相关信息,可分为静态数据和动态数据。其中,静态数据和动态数据中的通信消费信息来自于运营商的BSS域,动态数据中的业务偏好信息来自于运营商的OSS域,其分类及来源如图1所示。

互联网

图1 运营商用户数据特征

a) 静态数据:主要包括用户基本信息以及网络信息等方面数据。用户基本信息是不以电信网络为依托的数据信息,脱离电信网络该信息依然有效;用户网络信息是必须依附于电信网络才具有价值的数据信息。这2类信息具有稳定不变或者变化缓慢的特点,如:用户性别、用户职业、付费模式、终端信息、套餐信息、网络制式、手机号码、用户级别等在用户在网期间不会发生变更,或者有可能会发生变更但变更概率很低或变更周期较长;用户年龄、入网时间等属性随时间自然变更,无需预测。

b) 动态数据:用户不断变化的行为信息,譬如一个用户每月使用的通信费用,这些费用包含流量费用、语音费用、短信费用以及其他增值费用等,依据签约信息,每个人能够使用的流量、语音、短信等数量的多少,用户的哪些行为特征或偏好影响他们每天消费信息(包括使用了哪些应用及其时间、地点)。这些信息是每天、每月都发生变化且无明显的规律性,需要通过大数据挖掘的方式将其内在联系或特征展现出来。

在动态数据中,业务偏好信息及位置信息包含了人使用移动智能终端做业务的行动轨迹。在出门带手机即可的现阶段,人们用智能手机进行业务交互的频次很高,因此其业务轨迹可以用来判定人群职住信息,在不同时刻的大概地理范围。业务类别和APP类别是指人们在使用智能手机时喜欢用哪一类业务、哪一类APP,每次使用某一业务/APP的时长,一段时间内使用业务/APP的频次,由此可推断其关注点和兴趣点。

2 基于运营商大数据的大气污染防控方案

基于跨行业、多源、异构的大气环境质量监测和预报数据、运营商数据、企业数据等进行融合分析,搭建大气环境质量监测预报、影响评估与跟踪分析的大数据平台。基于此大数据平台实现精细化大气环境预报、溯源及科学污染防控,以达到更全面的对企业、群体个人的影响评估、预防以及重点污染区域的持续跟踪,并能为政府和企业提供个性化的产能动态规划和调整方案。基于运营商大数据的大气污染防控方案如图2所示。

互联网

图2 大气污染防控思路与方案图

a) 数据整合:通过对跨行业数据进行关联整合,包括空气质量数据、运营商数据、企业数据等,实现信息的地理化交互关联,从而实现数据的深度关联分析。

b) 平台搭建:对整合后的数据进行规范化存储和自动化解析及入库。将成熟的数据挖掘算法形成固化模型,并通过Hadoop、Impala等大数据技术,实现多参数、智能化、实时性的大数据分析平台。

c) 分析及挖掘:通过用户画像、用户轨迹、业务偏好等与大气质量现状分析、大气质量精细化预测模型相结合,实现对个人群体的影响评估及预防、对敏感人群的污染趋势预测推送、对污染区域的疏散预警等。通过大气数据与企业数据的关联,辅助实现污染溯源分析、污染源的产能动态规划等。

d) 产品及服务:基于数据分析及挖掘结果,明确细化产品需求,针对政府、企业和个人等不同服务对象,形成一系列面向政府、企业和公众的数据产品及服务,以达到辅助政府决策、提高企业产能、便捷服务民生的效果。

3 运营商数据在大气污染防控的应用探讨

基于整合后的多方数据源,形成基础数据调用库。搭建大数据平台,完成数据的规范化存储、自动化解析和入库、关键信息提取。通过上层数据分析及挖掘,形成一系列面向政府、企业和公众的数据产品及服务。主要的应用方向如表1所示。

表1 主要的应用方向

互联网

以下将着重探讨运营商数据在污染区域的人群防控和企业停开工的监察管理方面的应用。

3.1 污染区域的人群防控

目前,当城市遇到严重污染天气,每个人都会收到该城市空气质量严重污染提示短信,而实际情况是不同区域空气质量在不同时间是不一样的,有时差别还特别大。如果统一对城市的居民进行空气质量严重污染的提示推送,可能会对一些人提供错误的信息,不够精细化。

基于运营商数据,可获取人们的实时活动范围,这样便能对城市空气严重污染的区域中的人群进行精准的实时空气严重污染信息推送,实现空气质量信息的精准化推送,为人们的出行提供参考。同时,我们能精确获取空气严重污染区域的人群信息以及他们的特征,为空气质量影响评估提供更精确的数据和依据。

3.1.1 污染区域人群画像

通过对严重污染区域的人群进行用户画像及轨迹追踪,可将污染天气对人群的影响进行评估,从而进行有效的人群疏散及卫生防疫工作。图3是严重污染区域的人群分布热力示意图。

互联网

图3 某污染区域内人群聚集热力图

分析严重污染区域的人群情况,比如影响人数,人群性别占比、年龄分布、每小时的用户数量、不同时段的用户数分布等,进而评估对污染区域人群的影响。

3.1.2 易感人群污染防控

根据用户性别、年龄分布,公众开放场所如公园、步道等的聚集情况,活跃时段、使用APP数据(如用户搜索目的地天气、目的地导航)等信息,以及医疗场所周围的轨迹信息,锁定易感人群,并向其推送空气质量信息及防污染产品广告信息,提醒其及时采取卫生防疫措施。

针对幼儿园、中小学校、养老院、医院等易感人群聚集,且运营商数据不易捕获的区域,可通过企业全息名片库进行圈定,对其周围企业污染情况进行跟踪,减少对于易感人群的危害程度。

3.1.3 大气污染预测人群防控

将人群指数的预测情况与空气质量(PM2.5浓度)的预测情况,以及空气质量监测站实时监测数据进行地理化匹配,分析空气污染的预测以及实时污染情况对人群的影响程度,同时平台会实现高密群体影响的实时告警,从而实现污染对人群影响的有效防控。

预测分析未来空气污染的人群影响情况,如图4所示。

互联网

图4 某地未来空气污染的人群影响预测分析示意图

从图4可见,早高峰出行时,空气质量为黄色(2级),对人群影响不大。中午时段,移动用户主要集中在几大商业办公区域,同时从空气质量预测情况看,未来3小时可能会有中度雾霾从南向北来袭,此时可向热点区域常驻人员进行消息推送。晚高峰时段,城区已经进入中度雾霾。傍晚时段,人群逐渐分散,雾霾也逐渐减弱。

3.2 企业产能动态调整及监察

结合地方企业信息,建立污染区域企业全息名片库,包含企业分布、企业性质、企业规模、排放气体种类、排放量等。结合用户聚集、轨迹、业务特征等数据监控重点区域的工厂开工情况,对重污染天气下隐瞒开工的企业进行识别。通过污染物溯源信息,对不同天气条件下,工厂开工方案提供建议,实现工厂产能动态规划,在保证空气质量的前提下,减少对社会经济的影响。

3.2.1 企业开工监察

随着各地空气重污染应急预案的推出,每遇空气重污染时,各地政府需对污染排放的企业进行指导,特别是当空气污染达到一定的预警级别,应急预案就会对相应的一些制造业企业进行停产和限产。以往的做法是政府相关部门进行实地检查、抽查,来判断相关企业是否按照要求进行停产或限产措施。但是企业分布很广,执法工作人员有限,每次只能完成小比例的抽查工作,监管很难到位。而运营商有用户群体的特征信息,通过建模训练企业停工、开工时的用户群体的聚集状态、语音及数据业务特征、业务APP使用情况等一系列特征,即可初步判断企业的开工概率。通过与实际停开工情况进行对比,得到模型的准确度,进而再改进模型,提高判断的准确率,大大提高监管效率,节省人力物力和财力,为蓝天计划提供保障。

3.2.2 企业产能动态调整

随着时代的发展,人们对于环保问题愈发重视,但是目前的企业停产限产措施也拉低了地方的GDP,如何平衡好GDP和环保两者的关系,就显得非常重要。

可以通过分析空气污染溯源,结合人群聚集特征,针对不同类型的企业进行有针对性的检查指导,实现企业精准的产能动态调整,保证空气质量的同时,也兼顾企业产能的输出。比如根据污染物溯源分析,某日空气污染主要污染物来源为道路移动源而非工业移动源,因此可对枢纽路段进行车辆限行以减轻空气污染,而并非工厂停工。从而使污染防治做到有的放矢,提高防治效率。

4 结束语

本文从“人”的角度介绍了运营商数据的特征,并基于运营商数据进行大气污染防控的思路和方案研究,最后对基于运营商数据的大气污染防控进行应用探讨。作为能够触及到人群末端的运营商,存储着人群的画像、轨迹等信息,通过将精准化大气质量实时及预测数据与运营商数据结合,能够将大气质量对公众的影响精确到特定人群,实现精准触达,并且将空气污染的影响评估精确到每个人和区域;同时,可根据企业数据,实现企业产能的动态调整,保障蓝天的同时也保证企业产能。为“蓝天保卫战”贡献力量,运营商一直在行动。

责任编辑:gt

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分