炼数成金 门户 商业智能 脑科学 查看内容

大脑如何对我们所看到的东西进行识别,对人工智能发展有何帮助

2017-6-16 14:40| 发布者: 炼数成金_小数| 查看: 17424| 评论: 0|原作者: Salk Institute|来自: 人工智能学家

摘要: “理解大脑是如何处理视觉信息不只对视觉方面重要,它还为我们打开了一扇探究大脑一般性工作原理的窗户,”Salk计算神经生物学实验室的副教授Tatyana Sharpee说,“我们大脑大部分由被称作皮质柱的重复的计算单元组 ...

工具 算法 模型 计算机 商业智能

图片:右图显示了大脑的V1和V2区域是如何使用边缘和纹理信息来对像左图中泰迪熊的形象进行描绘。
 
也许你认为无人驾驶汽车这个目标是无法很快成为实现,那么有这种想法的不止你一个人。而用计算机编程来识别某个对象,这在技术上是非常具有挑战性的,特别是连我们的科学家们都不能完全明白大脑是如何做到的。

现在,Salk研究所的研究人员已经分析了大脑关键部分的神经元(称为V2)是如何对自然场景作出反应,从而更好地进行视觉处理并加深理解的。 这项研究工作在2017年6月8日的《自然通讯》杂志中进行了描述。

“理解大脑是如何处理视觉信息不只对视觉方面重要,它还为我们打开了一扇探究大脑一般性工作原理的窗户,”Salk计算神经生物学实验室的副教授Tatyana Sharpee说,“我们大脑大部分由被称作皮质柱的重复的计算单元组成。尤其在视觉方面,我们可以控制传递给大脑的较精确的输入,这让我们得以量化分析信号在大脑中的转化。”

Sharpee说,虽然我们经常把这种能看见东西的能力视为理所当然的,但是这种能力却是来自于一系列的复杂的数学转换,而我们现在还不能将这种转换在电脑中复制出来。事实上,我们的大脑有超过三分之一的部分是专门用于完成解析视觉场景的任务。

我们的视觉开始于眼睛中的明暗像素点。这些信号被发送到大脑背面的那个被称为V1的区域,在那里它们将被转换成对应着视觉边缘的场景。不知何故,由于这些信息和随之而来的多次转换,我们可以识别面部,汽车和其他物体,以及判断它们是否正在移动。这种识别的较精确度到现在仍然是一个谜,可能一部分的原因是因为神经元对编码对象做出了复杂的反应。

现在,Sharpee团队的博士后研究员Sharpee和Ryan Rowekamp已经开发了一种新的统计方法,让这些复杂的反应可以被描述、被解释,这种统计方法将用于帮助计算机模拟视觉的解码。为了进一步完善他们的模型,该团队使用了大脑计算神经科学协作研究中心的(CRCNS)数据库中的公开数据,来展示灵长类动物在看到一些电影中的自然景观(如森林景观)后,大脑会做出哪些反应。

“我们应用了新的统计技术,来确定电影中的哪些画面会使V2神经元改变他们的反应,Rowekamp说,“有趣的是,我们发现V2神经元对一些边缘的组合作出了反应。”
该团队透露,V2神经元根据三个原则处理视觉信息:首先,它们将所有具有相似特征的边缘组合起来,这就增加了感知的稳定性,然后在位于边缘轮廓部分的曲线区域会有一些小变化。第二,如果神经元被特定方向和特定位置的边缘部分激活,那么在同一位置的90度方向上则会被抑制,这称为“交叉取向抑制”。这些交叉定向边缘组合会以各种方式组装,来让我们对各种视觉形状进行检测。该团队发现,交叉定向对于较精确形状的检测至关重要。第三个原则是,在空间中用这种方式来不断重复相关的模式,这可以帮助我们感知树木或水表面的纹理和它们之间的边界,就如印象派绘画一般。

研究人员将这三种组织的原理纳入了一个二次卷积模型中,该模型可应用于其他的实验数据集。研究人员说,视觉处理可能与大脑如何处理气味、触觉或声音相类似,所以这项工作同样的也可以对这些领域的数据进行说明。

“在此之前我研究的模型与数据不完全兼容。”Rowekamp说,“因此,将边缘识别和敏感度结合在一起的这种方式开始成为分析和理解复杂视觉数据的工具,这种做法是很令人满意的。”

但是更直接的应用可能是用来改进无人驾驶汽车或其他机器人设备中的物品识别算法。Sharpee说 :“似乎只要是每次我们在计算机视觉算法中添加一些有关大脑的计算元素,它们的性能就会提高。”

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-7-23 06:20 , Processed in 0.149026 second(s), 23 queries .