电子说
炸鸡可乐蛋挞,烧烤火锅奶茶,游戏番剧代码,夕阳西下,阿宅瘫在沙发。面对高强度工作负荷带来的久坐、各种舌尖上的诱惑,以及一系列可以窝在沙发里进行的娱乐项目,肥胖在当代逐渐成了一个可以当作“梗”来谈论的问题。一首《卡路里》展开持续洗脑式轰炸的同时,AI也一直在不断尝试对肥胖这一难题“下手”,试图从更多层面加以挖掘与解释。
根据2018年8月31日在线发表于JAMA Network Open的一项研究显示(https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2698635),卷积神经网络(CNN)可从卫星图像中自动提取建筑环境的特质,并用于健康指标研究。而了解建筑环境的某些特征与肥胖症患病率之间关联,则有助于引导环境结构上的变化,从而达到促进运动、降低肥胖率的作用。
全球疾病负担报告表明,2015年全球约有超过6.03亿成年人在遭受肥胖问题的困扰;在美国,成年肥胖人口更是占据成年总人口数的三分之一。肥胖是一个复杂的健康问题,其间涉及的关联因素颇多,包括遗传学、人口统计学,以及行为学的影响。而不健康的饮食习惯和久坐不动的生活方式则都与所处的社会环境特质及建筑环境特征密切相关,环境可以通过其间的步行方便程度、土地使用、占地面积、住宅区、可用资源(活动及娱乐场所、餐饮店等)、贫困等级、安全感以及社区设计方案等来影响人们的健康,例如靠近自然空间或是人行道的建筑设计能够在增加运动量的同时促进定期活动,这一特征在城市中尤为明显。
一直以来,关于肥胖问题和建筑环境间这二者间关联的讨论并不鲜见,但尽管如此,研究人员仍在研究过程中注意到了一些不一致的结果,造成这些不一致的原因可能是测量方法和测量工具的跨研究变化所导致的评估及比对困难。此外,相关指标的测量过程可能代价高昂、耗时巨大,并且易受人的主观思维模式影响。因此,研究人员需要发掘一种一致性的测量方式,以实现跨研究比较。评估并量化建筑环境与肥胖间的关系有助于人们在社区基础上对相应健康问题加以适当的干预与防范。
对此,来自华盛顿大学的研究人员结合人工智能技术,提出了一种全面评估法,其中包含使用预训练的卷积神经网络(一种深度学习法)从高分辨率卫星图像中提取邻域的物理特征。事实上,类似的研究方法早在此前便受到了研究人员的关注。Nguyen QC等人2018年3月刊载于《JECH (Journal of Epidemiology and Community Health)》杂志的论文中,便提到了通过卷积神经网络对Google街景中的建筑环境图像进行分类,并借以评估肥胖与人行道、建筑类型、街道绿化(或景观美化)这三者间的关系。只是彼时的研究未能充分利用卷积神经网络独立发现关联因素的能力,仅局限于预设的三大变量。相较之下,此次华盛顿大学发布的最新论文则全面评估了建筑环境中的变量因素,并依据美国四个区人口普查肥胖率的细粒度关联进行方法论证。研究中所采用的方法皆可扩展,且都基于公开可用的数据与计算工具,可实现跨研究可比性。
▌研究方法
肥胖症患病率数据分析
数据来源:选取美国疾病防控中心“500 Cities”项目中的2014年度人口普查肥胖率粗略估值
分析方法:包含两个步骤。首先,利用卷积神经网络以及提取处理的POI(兴趣点)数据来处理卫星图像,以抓取建筑环境特征。随后,利用弹性网络回归建立一个简约模型来评估建筑环境与肥胖率之间的关联性。
获取卫星图像和POI数据
在设置好地理中心、图片尺寸(400*400像素)和缩放级别(缩放系数18)的情况下,从Google Static Maps API下载图像。将每个城市的地理范围划分为方形网格,其中每个点对应一对纬度和经度值,网格间距约150米。同时,利用人口普查区地图文件将每个图像与其对应的人口普查区相关联,排除城市范围外区域的图像。使用相同的方形网格来选取地理位置,并在适当的距离内开启径向附近搜索,以此实现在Google Places of Interest API上下载POI数据(此处不包含城市范围外的兴趣点)。该研究采集了96个独有的POI类别,并计算了每个人口普查区对应到每个相关类别下的位置数量。
图像处理
如今,卷积神经网络已经在关键的计算机视觉任务(如目标识别、图像分割)、健康相关的应用(如识别皮肤癌),以及贫困预测等领域的大数据集方面取得了突破性的成就。由于缺乏用于对高肥胖地区和低肥胖地区进行分类的大型标注数据集,研究人员采用了迁移学习(Transfer Learning)法,其中涉及使用预训练网络从包含近150000个卫星图像的未标注数据集中提取建筑环境特征。迁移学习包括微调预训练卷积神经网络以完成新任务(修改输出层)或将预训练卷积神经网络作为固定特征提取器(与线性分类器或回归模型相结合)。上述方法已经成功运用于明显不同于目标识别的计算机视觉任务。
研究中使用VGG-CNN-F网络,该网络有8层(5个卷积层和3个完全连接层),并且基于约120万个来自ImageNet数据库的图像进行了训练,以识别分属于1000个类别的目标。网络学习提取有助于目标检测的图像梯度、边缘和图案。诸多使用类似迁移学习方法的研究表明,从基于ImageNet数据训练的网络中提取的特征可有效地将航拍图像按照土地用途(如高尔夫球场、桥梁、停车场、建筑物和道路)进行细粒度语义分类。
研究人员收集了数据集中每个图像网络第二个完全连接层的输出,这一层有4096个节点,每个节点与其上一层及下一层的节点间呈非线性连接,每个特征向量为4096维,对应(也称激活)着来自这些节点的输出。通过计算人口普查区域所有图像的均值,这些输出进一步聚合成每个人口普查区的均值特征向量。这些特征共同代表建筑环境的指标。为了研究CNN能否区分建筑环境特征,研究人员通过网络向前传输了一组随机图像,并检查lCNN卷积输出的地图(图1)。同时,研究人员还对图像特征进行了分组,以此说明在肥胖率低和高的地区,建筑环境的特征存在差异(图2)。
图1 卷积神经网络模型下的特征可视化
图2
统计分析
运用弹性网络(一种正则化回归方法),消除了非重要协变量,保留了相关变量,非常适用于从该研究图像数据集中提取的高维(n = 4096)特征向量。弹性网络的正则化防止过拟合,这也是出于高纬度数据集的考量。为了选择合适的调整参数值(λ值),这里用到了交叉验证法,并选取了最小化均值交叉验证错误的值。
采用5折交叉验证回归分析法,以量化下列关联:
① 人口普查区建筑环境特征与肥胖率之间的关联;
② 人口普查区POI密度与肥胖率之间的关联;
③ 人口普查区建筑环境特征与人均收入差异之间的关联(数据来自“美国2014年度社区调查”中的未来五年预测)。
研究还将数据分为两个随机样本,并用样本1代表模型拟合中60%的数据,其余40%则在所有分析中进行验证。上述分析针对所有地区共同进行,并对每个地区独立进行。
除此之外,基于人工智能技术的食物营养成分分析项目、科学食疗方案、食物照片的卡路里识别项目、各种穿戴设备、语音识别智能家庭营养健康助手等应用早已数见不鲜,其中就包括Google在2015年推出的Im2Calories项目、2018年的Google Coach,以及雀巢公司与京东集团2017年在智能音箱“叮咚”上合作推出的雀巢小AI……
由是观之,人工智能在人类健康问题上的探索之路正在不断延伸。想要了解更多人工智能前沿技术与行业深度应用? 2018 AI 开发者大会(AI NEXTCon)来啦!
全部0条评论
快来发表一下你的评论吧 !