【完结】总结12大CNN主流模型架构设计思想

64 篇文章 26 订阅
订阅专栏
13 篇文章 10 订阅
订阅专栏

文章首发于微信公众号《有三AI》

【完结】总结12大CNN主流模型架构设计思想

专栏《CNN模型解读》正式完结了,在这一个专栏中,我们给大家回顾了深度学习中的各类具有代表性的CNN模型,详细分析了各类模型的特点,设计思想。当然,这一个系列不可能包含所有的模型,但是我们可以从中洞见最核心的思想。如果有必要,以后我们还会进行补充的。

作者 | 言有三

编辑 | 言有三

 

01 从LeNet5到VGG

LeNet5不是CNN的起点,但却是它的hello world,让大家看到了卷积神经网络商用的前景。

AlexNet是CNN向大规模商用打响的第一枪,夺得ImageNet 2012年分类冠军,宣告神经网络的王者归来。VGG以其简单的结构,在提出的若干年内在各大计算机视觉领域都成为了最广泛使用的benchmark。

它们都有着简单而又优雅的结构,同出一门。诠释了增加深度是如何提高了深度学习模型的性能。详细解读如下:

【模型解读】从LeNet到VGG,看卷积+池化串联的网络结构

 

02 1*1卷积

1*1卷积本身只是N*N卷积的卷积核半径大小退化为1时的特例,但是由于它以较小的计算代价增强了网络的非线性表达能力,给网络结构在横向和纵向拓展提供了非常好的工具,常用于升维和降维操作,尤其是在深层网络和对计算效率有较高要求的网络中广泛使用。

详细解读如下:

【模型解读】network in network中的1*1卷积,你懂了吗

 

03GoogLeNet

GoogLeNet夺得ImageNet2014年分类冠军,也被称为Inception V1。Inception V1有22层深,参数量为5M。同一时期的VGGNet性能和Inception V1差不多,但是参数量却远大于Inception V1。Inception的优良特性得益于Inception Module,结构如下图:

由1*1卷积,3*3卷积,5*5卷积,3*3最大池化四个并行通道运算结果进行融合,提取图像不同尺度的信息。如果说VGG是以深度取胜,那么GoogLeNet可以说是以宽度取胜,当然1*1卷积起到了很大的作用,这一点在SqueezeNet中也很关键。详细解读如下:

【模型解读】GoogLeNet中的inception结构,你看懂了吗

 

04MobileNets

脱胎于Xception的网络结构MobileNets使用Depthwise Separable Convolution(深度可分离卷积)构建了轻量级的28层神经网络,成为了移动端上的高性能优秀基准模型。

一个depthwise convolution,专注于该通道内的空间信息,一个pointwise convolution,专注于跨通道的信息融合,两者共同努力,然后强大,在此基础上的一系列模型如shufflenet等都是后话。详细解读如下:

【模型解读】说说移动端基准模型MobileNets

 

05残差网络

当深层网络陷身于梯度消失等问题而导致不能很有效地训练更深的网络时,脱胎于highway network的残差网络应运而生,附带着MSRA和何凯明的学术光环,诠释了因为简单,所以有效,但你未必能想到和做到的朴素的道理。

详细解读如下:

【模型解读】resnet中的残差连接,你确定真的看懂了?

 

06非正常卷积

谁说卷积一定要规规矩矩四四方方呢?MSRA总是一个出新点子的地方,在spatial transform network和activeconvolution的铺垫下,可变形卷积deformable convolution network如期而至。

文章依旧写的很简单,这是一个致力于提升CNN对具有不同几何形变物体识别能力的模型,关键在于可变的感受野。

【模型解读】“不正经”的卷积神经网络

 

07密集连接网络

说起来,DenseNet只不过是残差网络的升级版,将网络中的每一层都直接与其前面层相连,把残差做到了极致,提高了特征的利用率;因为可以把网络的每一层设计得很窄,提高计算性能。

不过还是那句话,就算你能想到,也未必能做到,我们还是单独详细解读如下:

【模型解读】全连接的卷积网络,有什么好?

 

08非局部神经网络

卷积神经网络因为局部连接和权重共享而成功,但是它的感受野是有限的。为了这样,我们不得不使用更深的网络,由此带来了三个问题。(1) 计算效率不高。(2) 感知效率不高。(3) 增加优化难度。这一次又是学神凯明带队出发,从传统降噪算法Non-Local中完成借鉴。

虽非真主流,了解一下也无妨。

【模型解读】从“局部连接”回到“全连接”的神经网络

 

09多输入网络

见惯了输入一个图像或者视频序列,输出分类,分割,目标检测等结果的网络,是否会想起输入两张,或者多张图片来完成一些任务呢,这就是多输入网络结构。

从检索,比对,到排序,跟踪,它可以做的事情有很多,你应该了解一下。

【模型解读】深度学习网络只能有一个输入吗

 

103D卷积

2D卷积玩腻了,该跳到更加高维的卷积了,常见的也就是3D卷积了。

虽然3D带来了暴涨的计算量,但是想想可以用于视频分类和分割,3D点云,想想也是有些小激动呢。

【模型解读】从2D卷积到3D卷积,都有什么不一样

 

11RNN和LSTM

不是所有的输入都是一张图片,有很多的信息是非固定长度或者大小的,比如视频,语音,此时就轮到RNN,LSTM出场了。

话不多说,好好学:

【模型解读】浅析RNN到LSTM

 

12 GAN

近几年来无监督学习领域甚至是深度学习领域里最大的进展非生成对抗网络GAN莫属,被誉为下一代深度学习,不管是研究热度还是论文数量,已经逼近甚至超越传统判别式的CNN架构。在研究者们的热情下,GAN已经从刚开始的一个生成器一个判别器发展到了多个生成器多个判别器等各种各样的结构。

快上车,因为真的快来不及了。

【模型解读】历数GAN的5大基本结构

 

总结

希望经历过这一个系列后,小伙伴们能够更好的认识CNN的结构,从只会使用别人的模型开始进阶到自己学会设计,调优,以后我也会来分享的,因为真正的干货,才刚刚揭开序幕呢。

转载文章请后台联系

侵权必究

感谢各位看官的耐心阅读,不足之处希望多多指教。后续内容将会不定期奉上,欢迎大家关注有三公众号 有三AI

主流架构演进与项目架构改造<十七>-------IOC架构设计1
webor2006的博客
09-01 160
目标: 继续接着上一次主流架构演进与项目架构改造<十六>-------主流架构实战搜索模块2的架构往前学习,这次主要是关于IOC相关的学习,先看一下总目标: 走进IOC的世界: 为什么需要IOC: 先来回忆一下咱们Android的代码: 后来就出现了ButterKnife View注入框架,ARouter Intent参数自动提取注入,如下: 两者实现原理简述: 编译时按照命名规则生成相应实现类,编织好findViewById的代码,运行时根据MainActivity的
第四章:AI模型主流框架 4.1 TensorFlow
AI天才研究院
01-19 485
TensorFlow是一种强大的深度学习框架,它已经成为了当今最热门的研究领域之一。随着人工智能技术的发展,TensorFlow将继续发展和完善,以应对各种挑战。提高深度学习模型的效率和性能,以应对大规模数据和复杂任务。提高深度学习模型的可解释性和可视化,以帮助研究人员更好地理解和优化模型。提高深度学习模型的可扩展性和可移植性,以适应不同的应用场景和平台。解决深度学习模型的泛化能力和鲁棒性,以应对不同的数据和任务。解决深度学习模型的隐私和安全性,以保护用户数据和隐私。
一文彻底搞懂CNN - 模型架构(Model Architecture)
m0_59235245的博客
09-02 1382
由输入层、卷积层、池化层以及全连接层组成,通过卷积操作提取图像特征,并通过池化减少参数数量,最终通过全连接层进行分类或回归。输入层:接收原始图像数据,可能需要进行预处理,如归一化、尺寸调整等。卷积层:通过一系列可学习的卷积核(或称为滤波器)对输入图像进行卷积操作,以提取图像中的局部特征。每个卷积核都会生成一个特征图(feature map),这些特征图共同构成了卷积层的输出。池化层:通常位于卷积层之后,用于对特征图进行下采样,以减少数据的空间维度和参数数量,同时保留重要特征。
CNN 常用的几个模型 LeNet5 AlexNet VGGNet Google Inception Net 微软ResNet残差神经网络
Dan的专栏
08-23 8406
LeNet5 LeNet-5:是Yann LeCun在1998年设计的用于手写数字识别的卷积神经网络,当年美国大多数银行就是用它来识别支票上面的手写数字的,它是早期卷积神经网络中最有代表性的实验系统之一。 LenNet-5共有7层(不包括输入层),每层都包含不同数量的训练参数,如下图所示。  LeNet-5中主要有2个卷积层、2个下抽样层(池化层)、3个全连接层3种连接方式 卷积层  卷积...
我的Android重构之旅:架构
weixin_34054866的博客
05-31 350
EF A舞蹈服 去年10月底来到了新公司,刚开始接手 Android 项目时,发现该项目真的是一团遭,项目开发上没有任何架构可言,开发人员连简单的 MVC、MVP 都不了解,Activity 及其臃肿,业务边界也不明确,因此我决定重新分析一下当前主流的几种开发架构,选出适合当前项目的架构形式。 这是“我的Android重构之旅”的开篇之章,在这一篇中,我将依次的和大家介绍一下 MVVM、MVP...
CNN经典架构
WYJ的博客
09-07 2113
PyTorch实现CNN的5种经典架构,欢迎相互学习交流!
模型架构选择:从传统NLP到Transformer
AI天才研究院
03-02 176
自然语言处理(NLP)是人工智能的重要分支,旨在使计算机能够理解、解释和生成人类语言。随着互联网的发展和数据量的激增,NLP技术在文本分类、机器翻译、情感分析、问答系统等多个领域得到了广泛应用。然而,NLP任务的复杂性和多样性对模型架构提出了巨大挑战。传统的NLP模型架构,如基于规则的方法、统计模型、词袋模型等,虽然在早期取得了一定的成果,但随着数据规模和任务复杂度的增加,这些方法逐渐暴露出其局限性。为了应对这些挑战,研究人员不断探索新的模型架构,从传统的RNN、CNN,到近年来备受瞩目的Transform
通过AI模型优化用户界面与体验设计
AI天才研究院
07-05 1222
通过AI模型优化用户界面与体验设计 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来 在当今数字化时代,用户界面(UI)和用
多模态视觉大模型(1):大模型架构
@bangbang的博客
04-28 1094
多模态指的是输入数据的类型,它可以是文本、视频、音频等不同的模态形式,包括各种表格,json,图像以及各种传感器采的数据在深度学习传统模式一般都是采用单模态训练范式,我们针对每一个模态甚至是每个任务,需要用单独的一个模型训练得到,但作为我们人类,对外面世界的感官,其实一直都是使用多个模态的信息,比如我们看视频的时候,我们会看图像,听声音,同时也会经常看字幕,这就包含了图像、音频、文字这三种模态的信息,而且三种模态信息之间互补,比如声音没听明白的地方,结合字幕就能看懂。
AlexNet-Cnn模型
02-20
其中,AlexNet作为CNN的一个标志性模型,不仅在2012年的ImageNet大规模视觉识别挑战赛(ILSVRC)中一举夺魁,还因其卓越的表现极大地推动了深度学习领域的发展。 #### 二、背景介绍 四年前,即2008年左右,由Yann ...
基于深度学习的面部表情和人物性别识别
12-26
基于深度学习的面部表情识别和任务性别识别,带摄像头的笔记本电脑,运行代码就可进行实时识别,里面模型,代码齐全。详情可咨询q:994329541
CNN系列框架
我の博客
11-09 2885
深度学习思想被提出后, 卷积神经网络在计算机视觉等领域取得了快速的应用, 有很多经典、有意思的网络框架也应然而生. 1. LeNet-5 LeNet-5卷积网络是由LeCun在1998年发表的《Gradient-Based Learning Applied to Document. Recognition》中提出的网络框架. 这是最早的一类卷积神经网络, 其在数字识别领域的应用方面取得了巨大的成功 (手写字体识别). 在LeNet-5中, 输入为 32×3232 \times 3232×32 的灰度图像
主流的处理器架构介绍
最新发布
MHD0815的博客
09-06 941
处理器架构是指定义处理器内部结构、指令集、数据格式以及处理器与外部世界交互方式的一组规则。不同的处理器架构有着不同的设计理念、性能特点以及应用场景。
【搬运】九大经典CNN框架汇总
Salmon_lee的博客
11-02 1134
详解深度学习经典网络架构(十):九大框架汇总_chenyuping333的博客-CSDN博客 DenseNet算法详解_AI之路-CSDN博客_densenet
CNN 模型的发展
weixin_45595437的博客
05-07 412
文章目录第一部分:现代 CNN 结构的演变第二部分:CNN 中的一些重点知识2.1 dropout 技术2.2 ReLU 激活函数及其变种2.3 梯度爆炸、梯度消失2.3.1 核心部分2.3.2 补充资料 第一部分:现代 CNN 结构的演变 优秀博客汇总: 1.机器之心:一文带你了解卷积神经网络CNN的发展史 第二部分:CNN 中的一些重点知识 2.1 dropout 技术 讲解: 知乎:深...
深度学习笔记002 神经网络与主流框架】
余莫星辰的博客
06-25 1753
无论是前段时间的阿尔法完胜柯洁,还是谷歌、苹果公开它的无人驾驶计划,无不说明一个事实:一场人工智能(AI)的革命已经开始!作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的技术,会不会感觉马上就out了?这篇文章带你来一起见识一下神经网络与深度学习主流框架。 1 从生物神经网络模型衍生出人工神经网络模型? 2 BP神经网络? 3 卷积神经网络? 4 深度学习主流
比较全的常见的架构设计思想整理
03-30 764
一、MPP 架构 1、MPP架构的基础概念 MPP (Massively Parallel Processing),即大规模并行处理,在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。 简单来说,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部
写文章

热门文章

  • 【AI大咖】再认识Yann LeCun,一个可能是拥有最多中文名的男人 48614
  • 【杂谈】扒一扒Reddit,Medium,Quora与知乎等国内外高质量AI社区与内容平台 41285
  • 【技术综述】一文道尽传统图像降噪方法 33353
  • 【技术综述】最全人脸数据集收录 20851
  • 【AI白身境】计算机视觉都有哪些研究方向 20435

分类专栏

  • 有三AI学院 17篇
  • AI工程师修行之路 40篇
  • 人脸图像 3篇
  • deep learning 64篇
  • 图像处理 18篇
  • C++
  • 开源框架 25篇
  • 深度学习模型 13篇
  • GAN 2篇
  • 杂谈 17篇
  • 目标检测 2篇
  • 开源数据集 1篇
  • 互联网公司 5篇
  • 优化 2篇
  • python 3篇
  • 前后端 2篇
  • 程序员 1篇
  • bug 1篇
  • AI1000问 13篇
  • AI大咖 3篇
  • 图像分割 13篇
  • TensorFlow2.0 1篇
  • 移动端DL框架 1篇
  • AutoML 1篇
  • 知识星球 5篇

最新评论

  • 水平集——那些我膜拜过的牛人2

    zzhdianzixiaobai: 讲的很好

  • 【视频课】永久免费!5小时快速掌握Pytorch框架入门及实战

    Ace_CS: 你好,买了您的生成对抗网络书后摘不到数据集,在您说的地址上找不到,能说的再详细点吗

  • 【通知】《深度学习之模型设计》第三次重印,欢迎读者支持!

    wn1900: 请问配套的源代码在哪里下载啊

  • 【AI大咖】再认识Yann LeCun,一个可能是拥有最多中文名的男人

    qqqqqqxsrgg: bets one fancy dinner表情包

  • 【视频课】永久免费课程!如何掌握好深度生成模型与GAN的基础理论知识

    苏全一: 我看这个GAN的课程不是收费99的么,不免费了么

大家在看

  • Linux驱动开发 内核时间管理 内核定时器使用 以及 从 应用层通过ioctl接口控制内核定时器
  • 分布式数据库的魔力 540
  • 小猿口算python
  • Linux常用命令 874
  • 基于springboot的菜谱个性化推荐系统 毕业设计-附源码08609 663

最新文章

  • 【通知】有三AI-CV中阶-GAN组正式下架!内容分拆至人脸组与图像质量组
  • AIGC与大模型技术课程 | 学术及技术专家指导,图文视频生成技术入门,Prompt技巧速通!...
  • 【知识星球】大模型与AIGC+从零学AI+项目与人才招聘共3大知识星球成立,共建有三AI星球社区生态...
2024年24篇
2023年84篇
2022年148篇
2021年144篇
2020年194篇
2019年356篇
2018年91篇
2017年8篇
2016年2篇
2015年1篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

言有三

三人行必有AI

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家合肥商场美陈布置宝山区玻璃钢雕塑厂家报价安居玻璃钢卡通雕塑湖北玻璃钢雕塑厂招聘玻璃钢人物雕塑制品商场情人节美陈方案长宁区玻璃钢雕塑服务为先商场美陈北京浙江户内玻璃钢雕塑定制玻璃钢雕塑造型厂家贵不贵金华人物玻璃钢雕塑生产厂家武汉佛像玻璃钢雕塑超市商场美陈报价湖南知名校园玻璃钢雕塑公司吉林玻璃钢动物雕塑厂商特供成都玻璃钢雕塑报价铜陵户内玻璃钢雕塑江苏玻璃钢雕塑订购江苏创意玻璃钢雕塑制作滁州景区玻璃钢雕塑上海广场玻璃钢雕塑公司江西卡通玻璃钢动物狮子雕塑潮州仿真玻璃钢雕塑信阳发光玻璃钢雕塑供应商电话玻璃钢雕塑上什么油漆商场天花美陈顺德玻璃钢雕塑厂江苏儿童玻璃钢雕塑定做玻璃钢仿真雕塑厂大悦城商场美陈香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化