Deconvolution, Upsampling, Unpooling, and Convolutional Sparse Coding

Deconvolution, Upsampling, Unpooling 。这几个入门概念一直模模糊糊,但是几乎每一篇 paper 里都会提及,所以抽点时间系统的整理归纳一下。

Upsampling

Upsampling 是指将图像上采样到更高分辨率的技术的统称。包括但不限于 Deconvolution , Unpooling。

最简单的方法是使用重采样和插值。即给定一张输入图像,将其重新缩放到所需的大小,然后使用插值方法(如双线性插值)计算每个新点处的像素值。

Unpooling 常用于神经网络中,表示 逆max pooling。详见 paper Unpooling: In the convnet, the max pooling operation is non-invertible, however we can obtain an approximate inverse by recording the locations of the maxima within each pooling region in a set of switch variables. In the deconvnet, the unpooling operation uses these switches to place the reconstructions from the layer above into appropriate locations, preserving the structure of the stimulus.

在卷积网络中,max pooling 操作是不可逆的,但是我们可以通过在一组开关变量中记录每个池化区域内的最大值的位置来获得近似的反向过程。在逆卷积网络中,unpooling 使用这些开关变量将之前的重建放置处理好,从而达到放大的目的。

Deconvolution卷积神经网络中经常被用来表示为卷积,但它并不是纯数学角度上的反卷积。与 unpooling 不同,卷积 的参数是可学习的。常用于将卷积网络的输出上采样到原始图像分辨率。逆卷积 也称为 convolution with fractional strides transpose convolution

可视化加深理解

 

Share this to:

发表评论

电子邮件地址不会被公开。 必填项已用*标注