人工智能全新突破：神经网络可自主识别图片中的对象

jolinzhe 2016-12-09 1534

人工智能

636人已加入

描述

　　据外媒报道，利用神经生物学方法，芬兰计算机科学家正在人工智能研究的过程中取得新突破：深度学习神经网络可以自主识别出图片中的对象，准确率达到了75%。

　　人脑非常奇妙。在几十年研究之后，人类仍然无法复制出人脑的超快计算速度。目前，计算机科学家可以利用的最强大工具是神经网络。这样的大型计算机网络能通过训练去解决复杂问题，而机制类似于人类的中枢神经系统，即利用不同层次的神经元解决问题的不同部分，最终合并为适当的答案。

　　目前的问题在于，这样的神经网络需要大量数据输入和训练，随后才能学会如何解决问题。例如，ImageNet是个很好的训练数据源，这一庞大的可视化信息数据库中包含100万张经过人工标注的照片。

　　这被称作“监督学习”，而真正的人工智能意味着，神经网络需要学会如何自动完成“无监督学习”。这正是芬兰创业公司Curious AI希望实现的目标。

　　Curious AI首席技术官安迪·拉斯姆斯(Antti Rasmus)在赫尔辛基的Slush 2016科技行业大会上表示：“人脑会进行大量的无监督学习。我们不需要反复告诉婴儿，勺子是什么。他们可以自动从环境中学习，并形成概念。”

　　“对人脑来说，根据某一对象形成概念很简单。这已在心理学中得到了研究，即‘格式塔理论’。人脑会将具备类似形状、颜色、运动状态和模式的东西归类在一起。我们采取的第一步是让深度学习系统能像人脑一样，对对象进行归类。”

　　将神经科学应用于人工神经网络

　　在神经科学中，名为“速率编码”的理论认为，大脑中神经元的激发速率越高，神经元就越活跃。神经元持续被激发。而80年代时，科学家发现，神经元会将自身组织在一起，代表不同的信息。

　　这一理论被称作“临时编码”。理论认为，神经元的激发时机很重要，而准确的激发时机定义了，在数万神经元中哪些神经元属于同一群体。因此，一部分神经元可以同时激发，帮助大脑识别一系列对象中的某个对象，例如一堆办公用品中的一块红布，而另一部分神经元会告知大脑，其他对象都属于背景信息。

　　拉斯姆斯表示：“我们的计算机算法集成了临时编码机制。我们在神经网络的每层中保存多个拷贝。整个神经网络被复制了4次。这意味着系统可以学习得知，每个拷贝代表了某个特定对象，而将这些对象合并在一起，就可以与原始图像进行匹配。”拉斯姆斯此前曾是英伟达的软件工程师，目前正在芬兰阿尔托大学从事深度学习的博士研究工作。

　　“通过将图像分为不同的4组，神经网络可以自行编码图像。这就是无监督学习，我们不用对系统进行任何标记。当我们向神经网络展示图片时，它会将图片自主分解成为元素(例如图片中的对象)。”

　　在神经网络将图片分解为单独元素之后，归类和识别对象就变得更容易，因为这些对象不会相互重叠，导致图像模糊不清。

　　知觉分组可以给深度学习带来变革

　　研究人员最初指导神经网络在无监督的情况下分析图片，组织对象，随后向图像加入标记信息(监督学习)，从而观察系统究竟学会了什么。他们发现，Curious AI的Tagger系统能实现75.1%的准确率。

　　作为对比，传统神经网络的准确率只有21%，比随机猜测的准确率仅仅高出1%。

　　拉斯姆斯表示：“这是革命性的研究，这使得无监督学习获得了进一步发展。通过让机器获得对象的概念，我们实现了更类似人脑的无监督学习。这可以帮助未来的研究，让神经网络进行更高层次的推理，学习对象与环境的相关性。”

　　“在当前系统中，计算机运行在基于统计的世界观中。如果让计算机进入人类生活的世界，那么非常重要的一点是让机器以类似人类的方式去理解世界。人们通常很难理解计算机视觉的效果很差，因为人眼视觉对我们来说很自然。”

　　该公司的相应论文《Tagger：深度无监督知觉分组》将于12月7日在巴塞罗那的“神经信息处理系统2016”深度学习大会上发表。

　　Curious AI正在寻找工业界的合作伙伴，在现实世界的人工智能系统中试点其深度学习技术。目前，该公司正与希望发展无人驾驶技术的汽车厂商进行接触。

打开APP阅读更多精彩内容