预先设置NAS算法能否实现AutoML自动机器学习革命

今日头条

1151人已加入

描述

AutoML(自动机器学习)是深度学习的新方式,利用大数据分析、高性能计算、数据管理、算法、边缘计算等技术。有了AutoML,我们就不再需要设计复杂的深度学习网络,用于数据采集、数据预处理、优化、应用、人工智能和机器识别等领域。AutoML是将机器学习应用于现实问题的端到端流程自动化的过程。

中国的人工智能市场

与美国相比,中国人工智能软件市场的规模接近美国60%以上。与中国软件市场占全球规模的比重相比,人工智能领域的创新成果显著。预计2020-2025年,中国人工智能市场复合增长率将达到35.2%,仍占据全球主导地位。

从整体解决方案来看,2020年人工智能技术支出已经占到行业企业IT支出的5.2%,预计到2024年,与AI相关的技术支出将占IT总支出的9.1%。从客户服务到运营流程,从生产制造到IT支撑部门,越来越多的组织中的业务流程和数字化应用正在集成或嵌入机器学习和AI技术,以支持业务智能决策。

企业级AutoML需具备的能力

如今,大多数用户对AutoML的概念和现状没有清晰的认识。结合当前产品和行业用户智能化现状的基础上,小蓝认为现阶段企业级AutoML产品必须具备六大能力,遵循机器学习发展流程的基础之上:适配行业属性、开放灵活、低代码易上手、可视化效果好、效率与成本平衡、支持快速部署。机器学习

AutoML最佳实践

某省银行

截至2020年末,该行总资产7574.83亿元人民币,下辖18家分行、2家直属支行,共494个营业网点。2018年以来,该银行启动数字化转型,成立数据银行部。目前AI团队规模在70人左右。坚持自主研发创新的发展路线,金融科技能力处于国内城市银行领先水平。

2018年以来,该银行采用开源社区的Zeppelin系统,实现了小规模、非协作的机器学习模型的开发。随着数据智能应用建设的加速,为实现企业级AI协同和云原生AI服务,2019年某省银行搭建企业级机器学习平台。该平台作为企业级模型开发和运营平台,为数据科学家和建模者提供处理后的数据,为上层业务应用提供接口工具。

主要在三个方向部署应用:

1)在营销方向:平台开发营销类模型、生产营销资源和话术,为客户经理提供产品销售预测和潜在客户名单筛选,实现数字化营销。

2)在运营方向上:采用OCR识别技术,让开户转账更加便捷,采用NLP技术,支持电话智能客服,优化升级智能知识库,利用预测模型,在网点智能派发现金,实现运营流程自动化。

3)在风控方向:平台上部署了信用记分卡等模型,基于DL算法进行联合建模,后者已实现拒绝回捞客户数万户,累计放款数千万人民币。目前,该银行自主研发了数十个机器学习项目,发布了OCR、NLP等数十项AI服务,日均调用数千次,场景工作量替代率达到70%,赋能全行业务数字化转型升级。

在AutoML方面,该银行使用DataCanvas的AutoML工具DAT,目前的效果主要体现在自动特征衍生和数据处理环节。目前该银行AI应用开发中最费时费力的部分是数据准备和特征选择环节。当具备场景和数据可用时,DAT可以帮助业务分析师直接上手应用程序开发。同时,DAT还可以帮助建模工程师处理特征和优化超参数。目前能节省20-30%的工作量,预计未来提效会更加明显。

某航空公司

该航空公司在多年的运营过程中积累了大量的数据。在智能化转型升级过程中,与高校、外部伙伴合作开发AI算法模型,探索智能化应用。

应用主要关注三种场景:

1)运行类:在燃油消耗管理的应用中,机载飞行数据记录仪QAR记录飞行参数数据,基于机器学习算法的航班燃油消耗影响因素模型可以通过分析这些数据为燃油精细化管理提供决策支持,实现单条航线在一个月内节省数十吨航油的成果。

2)飞机维修类:在发动机损伤识别场景中,需要采用工业视频内窥镜伸入发动机上预留的观察孔进行观察、拍摄图像,并通过基于深度学习的图像分析算法识别划痕的生长等情况,可以提高故障诊断的效率。2021年5月,该航空公司《数据驱动飞机健康监控与预测维修关键技术》获得2019年民航科学技术奖(民航全行业科技类的唯一奖项)一等奖,实现了民航维修领域的技术创新和能力突破。

3)营销类:营销部门人员正在AutoML开发AI算法,将用于票价分析、旅客人数预测等营销场景,其中人数预测模型也可用于飞机动态备餐场景。

某股份制银行

该行基于AutoML赋能多个行内数字化转型场景,如营销领域的产品推荐、风险控制领域的贷款违约率预测、反欺诈反洗钱、内部管理领域的现金流预测和员工行为监控管理。

基于AutoML,该行的开发人员可以基于平台的工作流使用已有算子快速定制、训练模型,对定制化开源模型进行统一的开发和管理,从而降低数据建模的门槛,减少代码量,提高建模效率。具体在模型训练方面,对于数量较小的模型仍然采用单机建模训练,对于Spark框架中样本超过百万的模型进行分布式训练。随着平台加快模型训练和部署,从模型构建、部署到生产应用的时间从1-2个月缩短到2-3周。从业务价值的角度来看,营销A/B测试表明,与业务专家的经验相比,该模型在客户引流和风险交易管理方面带来了显著的改善。

AutoML加速您的AI应用上线

在AI人才还不充足的今天,采用AutoML能够帮助组织快速形成AI能力,提高开发效率,降低需要人工操作的任务量,促进机器学习民主化等等。从机器学习开发流程的角度,AutoML可以减少人类在设计机器学习模型时出现的偏差和错误;企业也可以通过应用AutoML来降低雇佣高级专家的成本。随着组织中需要管理的模型数量的增长以及日益增加的应用AI实现智能化升级的需求,有必要考虑引入AutoML工具,加速智能化应用的部署上线。

蓝海大脑利用大数据分析、高性能计算、数据管理、算法、边缘计算等技术,自主研发的液冷GPU服务器为AutoML提供硬件保证。

审核编辑:符乾江

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分