L2 Regularization

See Weight Decay.

$L_{2}$ Regularization or Weight Decay, is a regularization technique applied to the weights of a neural network. We minimize a loss function compromising both the primary loss function and a penalty on the $L_{2}$ Norm of the weights:

$$L_{new}\left(w\right) = L_{original}\left(w\right) + \lambda{w^{T}w}$$

where $\lambda$ is a value determining the strength of the penalty (encouraging smaller weights).

Weight decay can be incorporated directly into the weight update rule, rather than just implicitly by defining it through to objective function. Often weight decay refers to the implementation where we specify it directly in the weight update rule (whereas L2 regularization is usually the implementation which is specified in the objective function).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 128 papers

Title	Date	Tasks	Status
Regularized Policy Iteration	Dec 1, 2008	L2 Regularizationreinforcement-learning	—Unverified
Regularized Training of Nearest Neighbor Language Models	Sep 16, 2021	L2 RegularizationLanguage Modeling	—Unverified
Renewable Energy Prediction: A Comparative Study of Deep Learning Models for Complex Dataset Analysis	Jan 27, 2025	Hyperparameter OptimizationL2 Regularization	—Unverified
Rethinking Conventional Wisdom in Machine Learning: From Generalization to Scaling	Sep 23, 2024	L2 RegularizationLanguage Modelling	—Unverified
Reverse Engineering Deep ReLU Networks An Optimization-based Algorithm	Dec 7, 2023	L2 Regularization	—Unverified
Revisiting Activation Regularization for Language RNNs	Aug 3, 2017	L2 RegularizationLanguage Modeling	—Unverified
Robust method for finding sparse solutions to linear inverse problems using an L2 regularization	Jan 3, 2017	L2 Regularization	—Unverified
Self-Distillation Amplifies Regularization in Hilbert Space	Feb 13, 2020	Knowledge DistillationL2 Regularization	—Unverified
Semantic segmentation for building houses from wooden cubes	Mar 28, 2025	L2 RegularizationSemantic Segmentation	—Unverified
Improved error rates for sparse (group) learning with Lipschitz loss functions	Oct 20, 2019	L2 Regularizationquantile regression	—Unverified
The Ant Swarm Neuro-Evolution Procedure for Optimizing Recurrent Networks	Sep 26, 2019	Inductive BiasL2 Regularization	—Unverified
The Theory Behind Overfitting, Cross Validation, Regularization, Bagging, and Boosting: Tutorial	May 28, 2019	L2 Regularization	—Unverified
Tighter Bound Estimation of Sensitivity Analysis for Incremental and Decremental Data Modification	Mar 6, 2020	Incremental LearningL2 Regularization	—Unverified
Tight Sample Complexity of Large-Margin Learning	Dec 1, 2010	ClassificationGeneral Classification	—Unverified
To Drop or Not to Drop: Robustness, Consistency and Differential Privacy Properties of Dropout	Mar 6, 2015	L2 Regularization	—Unverified
Towards a Better Understanding of Predict and Count Models	Nov 6, 2015	L2 Regularization	—Unverified
Training Dynamics of Nonlinear Contrastive Learning Model in the High Dimensional Limit	Jun 11, 2024	Contrastive Learningfeature selection	—Unverified
Understand the Effect of Importance Weighting in Deep Learning on Dataset Shift	May 6, 2025	L2 Regularization	—Unverified
Unsupervised Video Depth Estimation Based on Ego-motion and Disparity Consensus	Sep 3, 2019	Autonomous DrivingDepth And Camera Motion	—Unverified
Weight decay induces low-rank attention layers	Oct 31, 2024	L2 RegularizationLanguage Modelling	—Unverified
Super-Resolution for Remote Sensing Imagery via the Coupling of a Variational Model and Deep Learning	Dec 13, 2024	Image Super-ResolutionL2 Regularization	—Unverified
A Bayesian encourages dropout	Dec 22, 2014	L2 Regularization	—Unverified
A Bayesian traction force microscopy method with automated denoising in a user-friendly software package	May 4, 2020	DenoisingL2 Regularization	—Unverified
Achieving Strong Regularization for Deep Neural Networks	Jan 1, 2018	L2 Regularization	—Unverified
A Closer Look at Rehearsal-Free Continual Learning	Mar 31, 2022	Continual LearningKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 4 of 6Next →

No leaderboard results yet.