如何使用VGG网络进行MNIST图像分类

电子说

1.3w人已加入

描述

**1 **问题

VGG网络由牛津大学的Oxford Visual Geometry Group于2015年提出。从诞生之后就收到了学界的广泛关注。

图像分类

VGG网络,可以应用在人脸识别、图像分类等方面。VGG有两种结构,分别为16层和19层。具体结构在其文献做了详细表述,如下图所示。

图像分类

为了学习VGG网络,本组拟采用配置A在MNIST数据集上进行图像分类实验。

**2 **方法

首先MNIST的数据大小为28*28,需要进行resize才能作为VGG网络的输入;同时,本次实验只需要进行10分类,因此将网络本身的最后一层原做1000分类的soft-max层移除,替换为FC-10。网络实现代码如下:

图像分类

获取数据后进行resize操作:

图像分类

实验部分代码如下:

图像分类

图像分类

图像分类

图像分类

图像分类

图像分类

图像分类

图像分类

实验结果:

图像分类

**3 **结语

VGG主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能,从本次实验也可以看出,短时间少周期的训练并不能使得如此庞大的网络拥有很好的效果,而在比较小的网络如LeNet-5这样的网络上往往几个周期就能得到较高的精度。遗憾的是因为实验设备性能限制,网络的运行速度很慢,受限于内存大小,BatchSize的大小受限,最大只能到32,没有充足的调整空间。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分