您的位置:首页 → 新研究确定了人工智能如何无法再现人类视觉

当人类发现熟悉的面孔或迎面而来的车辆时,大脑只需要100毫秒(约十分之一秒)来识别它,更重要的是,将其置于正确的上下文中,以便可以理解,并且个人可以做出相应的反应。

不出所料,计算机可能能够更快地做到这一点,但它们是否与现实世界中的人类一样准确?并非总是如此,这是一个问题,根据西方神经影像学专家Marieke Mur领导的一项研究。

可以教计算机处理传入的数据,例如观察面部和汽车,使用称为深度神经网络或深度学习的人工智能。这种类型的机器学习过程在类似于人脑的分层结构中使用相互连接的节点或神经元。

关键词是“类似于”,因为计算机尽管具有深度学习的力量和前景,但尚未掌握人类的计算,而且至关重要的是,身体和大脑之间的通信和连接,特别是在视觉识别方面。

“虽然前景广阔,但深度神经网络远非人类视觉的完美计算模型,”心理学和计算机科学系联合任命的西方教授穆尔说。

以前的研究表明,深度学习不能完美地再现人类的视觉识别,但很少有人试图确定深度学习无法模仿人类视觉的哪些方面。

该团队使用了一种称为脑磁图(MEG)的非侵入性医学测试,该测试测量大脑电流产生的磁场。使用在物体观察期间从人类观察者那里获得的MEG数据,Mur和她的国际合作者检测到一个关键的故障点。他们发现,物体中易于命名的部分,如“眼睛”、“轮子”和“脸”,可以解释人类神经动力学的差异,超出了深度学习所能提供的差异。

“这些发现表明,深度神经网络和人类可能部分依赖于不同的对象特征进行视觉识别,并为模型改进提供指导,”Mur说。

该研究表明,深度神经网络无法完全解释人类观察者在查看物体(包括面部和动物)照片时测量的神经反应,并且对在现实世界环境中使用深度学习模型(例如自动驾驶汽车)具有重大意义。

“这一发现提供了关于神经网络无法理解的图像的线索,即指示生态相关对象类别(如面部和动物)的视觉特征,”Mur说。“我们建议神经网络作为大脑的模型,通过给它们一个更像人类的学习体验来改进,比如一种更强烈地强调人类在发育过程中所承受的行为压力的训练制度。

例如,对于人类来说,快速识别物体是否是接近的动物非常重要,如果是,则预测其下一个后果性动作。在训练期间整合这些压力可能有利于深度学习方法对人类视觉进行建模的能力。

智能推荐