VGG16模型常用于分类和定位任务

其名称来源于作者所属牛津大学视觉几何组(Visual Geometry Group )的缩写。

1、结构简洁

VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间由max-pooling (最大化池)划分,所有隐层的激活单元都采用了ReLU函数。

2、小卷积核和多卷积子层

VGG通过使用多个小卷积核(3×3)的卷积层代替卷积核的大卷积层,减少了参数,同时相当于进行了更多的非线性映射,提高了网络的拟合/表达能力

小卷积核是VGG的重要特征之一。 VGG模仿了AlexNet的网络结构,但在AlexNet中没有采用7×7这样较大的卷积核大小,而是通过减小卷积核的大小(3×3 ),增加卷积子层数来达到同样的性能(VGG )

VGG作者认为,通过两个3×3的卷积栈得到的感觉野的大小,相当于5×5的卷积; 通过33卷积得到的感觉域相当于77的卷积。

3、小池化核

与AlexNet的3×3池化核相比,VGG均采用2×2池化核。

4、通道数多

VGG网络的一层的信息数为64,后面的每层增加一倍,最多变为512个信息,信息数增加了,可以提取更多的信息。

5、层数更深、特征图更宽

由于卷积核集中在通道数的扩大上,池化集中在宽度和高度的缩小上,使得模型体系结构上的深度和宽度变宽,同时也抑制了计算量的增长规模。

6、全连接转卷积(测试阶段)

这也是VGG的特点之一,在网络测试阶段将训练阶段的3个全连接替换为3个卷积,由于测试得到的全体网络没有全连接的限制,能够接收任意宽度或高度的输入在测试阶段很重要。

如本节第一张图所示,输入图像为224x224x3。 当接下来的三个层全部为全连接时,在测试阶段,如果不将测试图像全部缩放到224x224x3,就无法满足接下来的全连接层的输入数的要求,测试工作的展开不方便。

输入1,224 x 224 x 3的图像,用64个3×3的卷积核创建两次卷积ReLU,卷积后的大小为224x224x64

2、进行最大化池化后,池化单元的大小为2×2 ),效果图像大小减半),池化后的大小为112x112x64

用3,128个3×3的卷积核制作2次卷积ReLU,大小为112x112x128

进行4、2×2的最大轮询池化,大小变为56x56x128

用5,256个3×3卷积核制作3次卷积ReLU,大小为56x56x256

进行6、2×2的最大轮询池化,大小变为28x28x256

用7,512个3×3的卷积核制作3次卷积ReLU,大小为28x28x512

进行8、2×2的最大轮询池化,大小变为14x14x512

用9,512个3×3的卷积核制作3次卷积ReLU,大小为14x14x512

进行10、2×2的最大轮询池化,大小变为7x7x512

11、2层1x1x4096、1层1x1x1000和全连接ReLU (共3层) ) )。

12、用softmax输出1000的预测结果

通过以上过程可以看出,VGG网络结构还很简洁,都是由小卷积核、小池化核、ReLU组合而成。 其简化图如下(以VGG16为例) :

1、增加深度可以有效提高性能

2、最佳机型: VGG16,从头到尾只需3×3卷积和2×2池化,简洁美观;

3 .卷积可以支持各种大小的图像,而不是全部连接

参考: https://blog.csdn.net/Roger Chen 1983/article/details/79549085

原文链接: https://blog.csdn.net/I comma/article/details/104426691

飞艇稳赚不赔的打法6个3×3卷积核制作3次卷积ReLU,大小为56x56x256

进行6、2×2的最大轮询池化,大小变为28x28x256

用7,512个3×3的卷积核制作3次卷积ReLU,大小为28x28x512

进行8、2×2的最大轮询池化,大小变为14x14x512

用9,512个3×3的卷积核制作3次卷积ReLU,大小为14x14x512

进行10、2×2的最大轮询池化,大小变为7x7x512

11、2层1x1x4096、1层1x1x1000和全连接ReLU (共3层) ) )。

12、用softmax输出1000的预测结果

通过以上过程可以看出,VGG网络结构还很简洁,都是由小卷积核、小池化核、ReLU组合而成。 其简化图如下(以VGG16为例) :

1、增加深度可以有效提高性能

2、最佳机型: VGG16,从头到尾只需3×3卷积和2×2池化,简洁美观;

3 .卷积可以支持各种大小的图像,而不是全部连接

参考: https://blog.csdn.net/Roger Chen 1983/article/details/79549085

原文链接: https://blog.csdn.net/I comma/article/details/104426691