机器视觉有望超越人类的极限
ImageNet大型视觉识别挑战赛,是一项为那些试图开发视觉机器人的科学家举办的年度比赛。参赛者必须针对那些具有特定图像的物体开发出相应的算法,而这个比赛很好的证明了这一趋势。
到目前为止,无法识别图像的计算机很难对数以百万计的图像进行解析和提取。但自2012年以来,参加这个挑战赛的人数在逐年增加,并且很有可能在近几年超过我们现有的这一部分。
那么,2012年发生了什么改变?一个来自加拿大多伦多大学的团队提出了一个叫做“监督”的算法,可以通过深卷积神经网络将图像划分为1,000个独立的类。
发明于1980年代初的深卷积神经网络,由多层排列的人工神经元组成,它们反映出了人类大脑处理视觉的方法。随着摩尔定律推动着计算机技术越来越强大,这些网络能够更好的模仿神经网络的实际运作方式。
如今的深卷积神经网络更加强大。今年ImageNet挑战赛的赢家是GoogLeNet,来自谷歌的工程师团队发明的算法只有6.65%的错误率,在相同任务中已经接近人类的错误率。
随着视觉网络成为互联网越来越重要的一部分,我们正看到图像学习的使用率在增加。Pinterest收购了VisualGraph,这是一家致力于机器视觉的企业,可以将图片中的衣服和手袋提取并分类。
来自谷歌GoogLeNet项目团队的工程师ChristianSzegedy,对于机器视觉的技术应用,可能远远超过我们人类使用眼睛的方式。他写道:
这些技术的进步将是我们更好的理解图像,这些进展也直接的将谷歌的产品,例如照片搜索,图片搜索,YouTube,汽车自动驾驶,以及任何需要图像识别的地方。
文章版权归西部工控xbgk所有,未经许可不得转载。
下一篇:中美云机器人合作研究取得成功