Making Convolutional Networks Shift-Invariant Again

2019-04-25Code Available1· sign in to hype

Richard Zhang

Code Available — Be the first to reproduce this paper.

Code

github.com/adobe/antialiased-cnns
Officialpytorch★ 0
github.com/mauriceweiler/MobiusCNNs
pytorch★ 80
github.com/tattaka/Antialiased-CNNs-Converter-PyTorch
pytorch★ 0
github.com/ricky40403/BlurPool
none★ 0
github.com/kornia/kornia/blob/e4a54c2d4fd9b8eaa88dec50061e33f7aee5d959/kornia/filters/blur_pool.py
pytorch★ 0
github.com/mnikitin/Shift-Invariant-CNNs
mxnet★ 0

Abstract

Modern convolutional networks are not shift-invariant, as small input shifts or translations can cause drastic changes in the output. Commonly used downsampling methods, such as max-pooling, strided-convolution, and average-pooling, ignore the sampling theorem. The well-known signal processing fix is anti-aliasing by low-pass filtering before downsampling. However, simply inserting this module into deep networks degrades performance; as a result, it is seldomly used today. We show that when integrated correctly, it is compatible with existing architectural components, such as max-pooling and strided-convolution. We observe increased accuracy in ImageNet classification, across several commonly-used architectures, such as ResNet, DenseNet, and MobileNet, indicating effective regularization. Furthermore, we observe better generalization, in terms of stability and robustness to input corruptions. Our results demonstrate that this classical signal processing technique has been undeservingly overlooked in modern deep networks. Code and anti-aliased versions of popular networks are available at https://richzhang.github.io/antialiased-cnns/ .

Tasks

Classification Consistency Conditional Image Generation Domain Generalization Image Classification Image Generation

Benchmark Results

Dataset	Model	Metric	Claimed	Verified	Status
VizWiz-Classification	ResNet-101 (lpf3)	Accuracy - All Images	41.7	—	Unverified
VizWiz-Classification	ResNet-50 (lpf5)	Accuracy - All Images	41.5	—	Unverified
VizWiz-Classification	ResNet-101 (lpf2)	Accuracy - All Images	41.1	—	Unverified
VizWiz-Classification	ResNet-101 (lpf5)	Accuracy - All Images	41	—	Unverified
VizWiz-Classification	ResNet-50 (lpf2)	Accuracy - All Images	40.3	—	Unverified
VizWiz-Classification	ResNet-50 (lpf3)	Accuracy - All Images	40	—	Unverified
VizWiz-Classification	DenseNet121 (lpf5)	Accuracy - All Images	38.7	—	Unverified
VizWiz-Classification	ResNet-34 (lpf2)	Accuracy - All Images	38.3	—	Unverified
VizWiz-Classification	DenseNet-121 (lpf3)	Accuracy - All Images	38.3	—	Unverified
VizWiz-Classification	ResNet-34 (lpf3)	Accuracy - All Images	38.3	—	Unverified
VizWiz-Classification	DenseNet-121 (lpf2)	Accuracy - All Images	38.3	—	Unverified
VizWiz-Classification	VGG-16 BN (lpf2)	Accuracy - All Images	37.2	—	Unverified
VizWiz-Classification	ResNet-34 (lpf5)	Accuracy - All Images	37.2	—	Unverified
VizWiz-Classification	VGG-16 BN (lpf5)	Accuracy - All Images	37	—	Unverified
VizWiz-Classification	VGG-16 BN (lpf3)	Accuracy - All Images	36.9	—	Unverified
VizWiz-Classification	MobileNetV2 (lpf3)	Accuracy - All Images	36	—	Unverified
VizWiz-Classification	MobileNetV2 (lpf5)	Accuracy - All Images	35.8	—	Unverified
VizWiz-Classification	ResNet-18 (lpf3)	Accuracy - All Images	35.6	—	Unverified
VizWiz-Classification	MobileNetV2 (lpf2)	Accuracy - All Images	35.5	—	Unverified
VizWiz-Classification	ResNet-18 (lpf2)	Accuracy - All Images	35.5	—	Unverified
VizWiz-Classification	VGG-16 (lpf3)	Accuracy - All Images	35.1	—	Unverified
VizWiz-Classification	ResNet-18 (lpf5)	Accuracy - All Images	34.7	—	Unverified
VizWiz-Classification	VGG-16 (lpf5)	Accuracy - All Images	34.5	—	Unverified
VizWiz-Classification	VGG-16 (lpf2)	Accuracy - All Images	33.5	—	Unverified
VizWiz-Classification	AlexNet (lpf3)	Accuracy - All Images	23.1	—	Unverified
VizWiz-Classification	AlexNet (lpf2)	Accuracy - All Images	22.8	—	Unverified
VizWiz-Classification	AlexNet (lpf5)	Accuracy - All Images	22.7	—	Unverified

Making Convolutional Networks Shift-Invariant Again

Code

Abstract

Tasks

Benchmark Results

Reproductions