6.4 多输入多输出通道
1.多输入通道
多输入通道:
每个通道有一个独立的2维卷积核,所有通道的卷积结果相加得到输出结果。
2.多输入多输出通道
用ci和co分别表示输入和输出通道的数量,用kh和kw表示卷积核的尺寸,那么,对ci个输入通道,每一个通道都需要一个卷积核(识别并组合输入中的模式),于是,要输出一个通道,所需的卷积核尺寸就是ci*kh*kw的,那么要输出co个通道(识别输入中的co个特定模式),所需的卷积核尺寸就是co*ci*kh*kw的。
通道是干什么用的?
输入通道中的卷积核识别并组合输入中的模式。
每个输出通道可以识别特定模式。(输出的每个通道对应的那个3d卷积核都是不同的,不同的卷积核自然能识别不同的模式。)
举个例子,比如要识别一只猫:原始的图片进来后,底层的网络可能会用不同的通道分别识别图像的小局部的信息,如:这里是一个什么角度的边,那里是一个什么角度的边等;稍高层的会把识别到的纹理组合起来,比如这里是猫耳朵的纹理,那里是猫的胡须的纹理等;到很高层的时候,可能每个通道识别出来的都是很高级的模式,比如这里是猫头,那里是猫耳朵等等。最高层识别出这是一只猫。
总结:
(1)输出通道数是卷积层的超参数(注意输入通道数不是,输入通道数是前一层的输出通道数,是前一层的超参数。)。
(2)每个输入通道有独立的2维卷积核,所有通道结果相加得到一个输出结果。
(3)每个输出通道有独立的3维卷积核。
3. 1*1的卷积核
1*1的卷积看起来似乎没有多大意义。 毕竟,卷积的本质是有效提取相邻像素间的相关特征。然而,1*1的卷积核是一个受欢迎的选择。它不识别空间模式,只是融合通道。我们可以将1*1的卷积层看作是在每个像素位置应用的全连接层,以ci个输入值转换为co个输出值。
下图展示了3个输入通道2个输出通道的1*1卷积,浅蓝表示第0个输出通道的计算,深蓝表示第1个输出通道的计算。
个人理解:1*1的卷积将输入通道中的3种模式按权重(这个权重就是1*1卷积核的值)叠加,并输出2种新的模式。
完整的2维卷积层总结: