人工智能全新突破:神经网络可自主识别图片中的对象

人工智能

636人已加入

描述

  据外媒报道,利用神经生物学方法,芬兰计算机科学家正在人工智能研究的过程中取得新突破:深度学习神经网络可以自主识别出图片中的对象,准确率达到了75%。

  人脑非常奇妙。在几十年研究之后,人类仍然无法复制出人脑的超快计算速度。目前,计算机科学家可以利用的最强大工具是神经网络。这样的大型计算机网络能通过训练去解决复杂问题,而机制类似于人类的中枢神经系统,即利用不同层次的神经元解决问题的不同部分,最终合并为适当的答案。

  目前的问题在于,这样的神经网络需要大量数据输入和训练,随后才能学会如何解决问题。例如,ImageNet是个很好的训练数据源,这一庞大的可视化信息数据库中包含100万张经过人工标注的照片。

  这被称作“监督学习”,而真正的人工智能意味着,神经网络需要学会如何自动完成“无监督学习”。这正是芬兰创业公司Curious AI希望实现的目标。

  Curious AI首席技术官安迪·拉斯姆斯(Antti Rasmus)在赫尔辛基的Slush 2016科技行业大会上表示:“人脑会进行大量的无监督学习。我们不需要反复告诉婴儿,勺子是什么。他们可以自动从环境中学习,并形成概念。”

  “对人脑来说,根据某一对象形成概念很简单。这已在心理学中得到了研究,即‘格式塔理论’。人脑会将具备类似形状、颜色、运动状态和模式的东西归类在一起。我们采取的第一步是让深度学习系统能像人脑一样,对对象进行归类。”

  将神经科学应用于人工神经网络

  在神经科学中,名为“速率编码”的理论认为,大脑中神经元的激发速率越高,神经元就越活跃。神经元持续被激发。而80年代时,科学家发现,神经元会将自身组织在一起,代表不同的信息。

  这一理论被称作“临时编码”。理论认为,神经元的激发时机很重要,而准确的激发时机定义了,在数万神经元中哪些神经元属于同一群体。因此,一部分神经元可以同时激发,帮助大脑识别一系列对象中的某个对象,例如一堆办公用品中的一块红布,而另一部分神经元会告知大脑,其他对象都属于背景信息。

  拉斯姆斯表示:“我们的计算机算法集成了临时编码机制。我们在神经网络的每层中保存多个拷贝。整个神经网络被复制了4次。这意味着系统可以学习得知,每个拷贝代表了某个特定对象,而将这些对象合并在一起,就可以与原始图像进行匹配。”拉斯姆斯此前曾是英伟达的软件工程师,目前正在芬兰阿尔托大学从事深度学习的博士研究工作。

  “通过将图像分为不同的4组,神经网络可以自行编码图像。这就是无监督学习,我们不用对系统进行任何标记。当我们向神经网络展示图片时,它会将图片自主分解成为元素(例如图片中的对象)。”

  在神经网络将图片分解为单独元素之后,归类和识别对象就变得更容易,因为这些对象不会相互重叠,导致图像模糊不清。

  知觉分组可以给深度学习带来变革

  研究人员最初指导神经网络在无监督的情况下分析图片,组织对象,随后向图像加入标记信息(监督学习),从而观察系统究竟学会了什么。他们发现,Curious AI的Tagger系统能实现75.1%的准确率。

  作为对比,传统神经网络的准确率只有21%,比随机猜测的准确率仅仅高出1%。

  拉斯姆斯表示:“这是革命性的研究,这使得无监督学习获得了进一步发展。通过让机器获得对象的概念,我们实现了更类似人脑的无监督学习。这可以帮助未来的研究,让神经网络进行更高层次的推理,学习对象与环境的相关性。”

  “在当前系统中,计算机运行在基于统计的世界观中。如果让计算机进入人类生活的世界,那么非常重要的一点是让机器以类似人类的方式去理解世界。人们通常很难理解计算机视觉的效果很差,因为人眼视觉对我们来说很自然。”

  该公司的相应论文《Tagger:深度无监督知觉分组》将于12月7日在巴塞罗那的“神经信息处理系统2016”深度学习大会上发表。

  Curious AI正在寻找工业界的合作伙伴,在现实世界的人工智能系统中试点其深度学习技术。目前,该公司正与希望发展无人驾驶技术的汽车厂商进行接触。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分