深度学习超分辨率重建（三）： TensorFlow—— ESPCN

安全运维
21年12月12日
编辑

aqzt

释放双眼，带上耳机，听听看~！

基于TensorFlow的代码下载：https://github.com/drakelevy/ESPCN-TensorFlowhttps://

文章链接：
(Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network
, CVPR2016)

环境配置：深度学习（一）：虚拟机Linux系统搭建CPU TensorFlow

基础理论学习方便理解：deeplearning.ai 吴恩达网上课程学习（十五）——卷积神经网络及其TensorFlow代码实现

1. ESPCN

像SRCNN那样的方法，由于需要将低分辨率图像通过上采样插值得到与高分辨率图像相同大小的尺寸，再输入到网络中，这意味着要在较高的分辨率上进行卷积操作，从而增加了计算复杂度。本文提出了一种直接在低分辨率图像尺寸上提取特征，计算得到高分辨率图像的高效方法。ESPCN网络结构如下图所示

ESPCN的核心概念是
亚像素卷积层(sub-pixel convolutional layer)。网络的输入是原始低分辨率图像，通过三个卷积层以后，得到通道数为的与输入图像大小一样的特征图像。再将特征图像每个像素的个通道重新排列成一个的区域，对应高分辨率图像中一个大小的子块，从而大小为的特征图像被重新排列成的高分辨率图像。这个变换虽然被称作sub-pixel convolution, 但实际上并没有卷积操作。通过使用sub-pixel convolution, 图像从低分辨率到高分辨率放大的过程，插值函数被隐含地包含在前面的卷积层中，可以自动学习到。只在最后一层对图像大小做变换，前面的卷积运算由于在低分辨率图像上进行，因此效率会较高

我理解的亚像素卷积层包含两个过程，一个普通的卷积层和后面的排列像素的步骤。就是说，最后一层卷积层输出的特征个数需要设置成固定值，即放大倍数r的平方，这样总的像素个数就与要得到的高分辨率图像一致，将像素进行重新排列就能得到高分辨率图。

在ESPCN网络中，图像尺寸放大过程的插值函数被隐含地包含在前面的卷积层中，可以自动学习到。由于卷积运算都是在低分辨率图像尺寸大小上进行，因此效率会较高。

训练时，可以将输入的训练数据，预处理成重新排列操作前的格式，比如将21×21的单通道图，预处理成9个通道，7×7的图，这样在训练时，就不需要做重新排列的操作。另外，ESPCN激活函数采用tanh替代了ReLU。损失函数为均方误差。

{{userData.name}}已认证

深度学习超分辨率重建（三）： TensorFlow—— ESPCN

Java定时框架Quartz实例详解与定时任务的Mongodb、Mysql持久化实现（一）Quartz组件

Ubuntu上NFS的安装配置

{{userData.name}}已认证

Related posts:

Java定时框架Quartz实例详解与定时任务的Mongodb、Mysql持久化实现（一）Quartz组件

Ubuntu上NFS的安装配置

Linux(内核剖析):03---进程总体概述

Linux(内核剖析):13---系统调用的实现与解析

mysql-数据库高并发优化配置

MySQL配置文件my.cnf优化详解