无监督特征学习与视觉编码模型

 

无监督特征学习近年来应用越发广泛,将它引入视觉编码模型,会产生怎样的效果呢?...



认知神经科学的一个重要目的就是描述视觉刺激与人类大脑活动之间的对应关系。这种关系可以由两个独特的模型来描述,视觉编码模型和视觉解码模型。用于预测某一特定刺激特征的单体素响应的编码模型主要由两个部分组成:第一部分是一个由刺激空间到特征空间的线性/非线性映射;第二部分是由特征空间到体素空间的线性/非线性变换。最近的视觉编码模型的趋势是采用自然图像来作为响应刺激特征的体素的描述。这主要是由于自然图像容许多重特征空间,例如低级边缘特征,中级边缘交汇点特征,高级的目标组成部分特征,来调节单体素响应。

在之前的视觉模型和自然图像统计学的基础上,研究人员提出了一个通用方法来建立单体素对于生态有效刺激的统计适应表示的响应的可测试的预测模型。并且,为了证实这个方法,研究人员利用了一个精简计算模型,这个模型主要有两个组成部分。第一部分是一个非线性特征模型,用于将未加工的刺激转换为刺激特征,这部分主要使用了一个两层的稀疏编码模型(SC模型)来学习这两者之间的映射关系。第二部分是一个线性体素模型,将刺激特征转换为体素响应,主要利用一个正则化线性回归模型来得到这个转换关系。将体素模型与SC模型中的复杂细胞相结合可以得到一个编码模型(SC2模型),同理,将体素模型与Gabor小波金字塔模型(GWP模型)中的复杂细胞结合也可得到编码模型(GWP2模型)。研究中使用的fMRI数据来自于两个被试的初级视觉区(V1,V2,V3)。

图1 SC2模型与GWP2模型的编码性能比较
图1为两个编码模型的性能比较。编码模型的性能评价主要由R2来量化评价,R2是实际观测到的体素响应与预测的体素响应之间的相关系数。结果证明了此计算模型在低级视觉区的编码能力要明显好于基于传统的Gabor小波金字塔模型建立的编码模型。

文章来源:doi:10.1371/journal.pcbi.1003724


    关注 脑功能解析与脑机交互


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册