ITPub博客

首页 > 人工智能 > 深度学习 > 谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

深度学习 作者:dicksonjyl560101 时间:2019-08-25 09:18:33 0 删除 编辑



  2019-08-24 20:38:40

专栏推荐

正文

GoogLeNet是一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度来获得更好的训练效果,但层数的增加会带来很多负作用,比如过拟合、梯度消失、梯度爆炸等。

为了简化计算成本,先通过一个 1×1的卷积层,再通过一个 5×5 的卷积层,1×1 的层可能有 16 个通道,而 5×5 的层输出为 28×28×32,也就是32 个通道

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

然后先通过一个 1×1的卷积层,再通过一个 3*3 的卷积层

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

然后直接通过一个1*1的卷积层,这时就不必在后面再跟一个 1×1 的层了,假设这个层的输出是 28×28×64。

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

然后是池化层,我们先使用same填充的3*3,s=1的对其进行池化操作,保证维度还是28*28*192,然后使用1*1的卷积层(也就是使用 32 个维度为1×1×192 的过滤器)对其进行缩小通道处理,缩小到 28×28×32。

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

最后,将这些方块全都连接起来。在这过程中,把得到的各个层的通道都加起来,最后得到一个 28×28×256 的输出。

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

这就是一个 Inception 模块,而 Inception 网络所做的就是将这些模块都组合到一起。

我们来看一下真实的Inception 网络的图片,你会发现图中有许多重复的Inception模块

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

还有一个细节在网络的最后几层位置使用了全连接层,它也包含了一个隐藏层,通过一些全连接层,然后有一个 softmax 来预测,输出结果的标签。你应该把它看做 Inception 网络的一个细节,它确保了即便是隐藏单元和中间层也参与了特征计算,它们也能预测图片的分类。它在 Inception 网络中,起到一种调整的效果,并且能防止网络发生过拟合。

谷歌的googLeNet卷积神经网络为什么在计算机视觉领域如此强大?

所以 Inception 网络只是很多这些你学过的模块在不同的位置重复组成的网络,所以如果你理解了之前所学的 Inception 模块,你就也能理解 Inception 网络。



https://www.toutiao.com/a6728711374198800909/



来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29829936/viewspace-2654856/,如需转载,请注明出处,否则将追究法律责任。

上一篇: CNN模型参数解析
请登录后发表评论 登录
全部评论
行万里路,读万卷书,阅无数人。 吃货一枚,爱吃湘菜,川菜,粤菜与杭帮菜,尝遍天下美食。 摄影爱好者,游遍名川大山,江河胡海,赏遍人间春色。 爱看影,尤其是港片,好莱坞大片。英文名:DicksonJin, 网名:风一样的BOY。精通SAP供应链咨询。2017年开始研习人工智能。

注册时间:2014-08-27

  • 博文量
    2135
  • 访问量
    3244047