Stochastic Optimization

Stochastic Optimization is the task of optimizing certain objective functional by generating and using stochastic random variables. Usually the Stochastic Optimization is an iterative process of generating random variables that progressively finds out the minima or the maxima of the objective functional. Stochastic Optimization is usually applied in the non-convex functional spaces where the usual deterministic optimization such as linear or quadratic programming or their variants cannot be used.

Source: ASOC: An Adaptive Parameter-free Stochastic Optimization Techinique for Continuous Variables

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 1387 papers

Title	Date	Tasks	Status	Hype	Score
Stochastic Gradient Descent Captures How Children Learn About Physics	Sep 25, 2022	Stochastic Optimization	CodeCode Available	1	5
Stochastic Gradient Methods with Layer-wise Adaptive Moments for Training of Deep Networks	May 27, 2019	General Classificationimage-classification	CodeCode Available	1	5
Efficient approximation of Jacobian matrices involving a non-uniform fast Fourier transform (NUFFT)	Nov 4, 2021	compressed sensingImage Reconstruction	CodeCode Available	1	5
Stochastic Hyperparameter Optimization through Hypernetworks	Feb 26, 2018	BIG-bench Machine LearningHyperparameter Optimization	CodeCode Available	1	5
An Analysis of the Adaptation Speed of Causal Models	May 18, 2020	Meta-LearningStochastic Optimization	CodeCode Available	1	5
The Acquisition of Physical Knowledge in Generative Neural Networks	Oct 30, 2023	Stochastic Optimization	CodeCode Available	1	5
Training Deep Networks without Learning Rates Through Coin Betting	May 22, 2017	Stochastic Optimization	CodeCode Available	1	5
Training-free Diffusion Model Alignment with Sampling Demons	Oct 8, 2024	DenoisingImage Generation	CodeCode Available	1	5
Adaptive Semantic Token Communication for Transformer-based Edge Inference	May 23, 2025	object-detectionObject Detection	CodeCode Available	1	5
Cyclical Stochastic Gradient MCMC for Bayesian Deep Learning	Feb 11, 2019	Bayesian InferenceDeep Learning	CodeCode Available	1	5
Why Do We Need Weight Decay in Modern Deep Learning?	Oct 6, 2023	Deep Learningimage-classification	CodeCode Available	1	5
A Better Alternative to Error Feedback for Communication-Efficient Distributed Learning	Jun 19, 2020	Federated LearningStochastic Optimization	CodeCode Available	1	5
Differentiable Quality Diversity	Jun 7, 2021	DiversityStochastic Optimization	CodeCode Available	1	5
End-to-End Stochastic Optimization with Energy-Based Model	Nov 25, 2022	SchedulingStochastic Optimization	CodeCode Available	1	5
Distributionally Robust Neural Networks	May 1, 2020	L2 RegularizationNatural Language Inference	CodeCode Available	1	5
Distributionally Robust Neural Networks for Group Shifts: On the Importance of Regularization for Worst-Case Generalization	Nov 20, 2019	Domain GeneralizationNatural Language Inference	CodeCode Available	1	5
Exploiting Explainable Metrics for Augmented SGD	Mar 31, 2022	Stochastic Optimization	CodeCode Available	1	5
Federated Learning over Wireless Networks: Convergence Analysis and Resource Allocation	Oct 29, 2019	Federated LearningPrivacy Preserving	CodeCode Available	1	5
A Novel Unified Parametric Assumption for Nonconvex Optimization	Feb 17, 2025	Stochastic Optimization	CodeCode Available	1	5
Apollo: An Adaptive Parameter-wise Diagonal Quasi-Newton Method for Nonconvex Stochastic Optimization	Sep 28, 2020	Stochastic Optimization	CodeCode Available	1	5
Adaptivity of Stochastic Gradient Methods for Nonconvex Optimization	Feb 13, 2020	Stochastic Optimization	CodeCode Available	1	5
Adaptivity without Compromise: A Momentumized, Adaptive, Dual Averaged Gradient Method for Stochastic Optimization	Jan 26, 2021	Stochastic Optimization	CodeCode Available	1	5
Learning from History for Byzantine Robust Optimization	Dec 18, 2020	Federated LearningStochastic Optimization	CodeCode Available	1	5
Lookahead Optimizer: k steps forward, 1 step back	Jul 19, 2019	Image ClassificationMachine Translation	CodeCode Available	1	5
ATD: Augmenting CP Tensor Decomposition by Self Supervision	Jun 15, 2021	Data AugmentationDimensionality Reduction	CodeCode Available	1	5
Monte Carlo Policy Gradient Method for Binary Optimization	Jul 3, 2023	Combinatorial OptimizationDiversity	CodeCode Available	1	5
Online Learning Rate Adaptation with Hypergradient Descent	Mar 14, 2017	Hyperparameter OptimizationStochastic Optimization	CodeCode Available	1	5
On the Variance of the Adaptive Learning Rate and Beyond	Aug 8, 2019	image-classificationImage Classification	CodeCode Available	1	5
Adafactor: Adaptive Learning Rates with Sublinear Memory Cost	Apr 11, 2018	Machine TranslationStochastic Optimization	CodeCode Available	1	5
ADMM for Efficient Deep Learning with Global Convergence	May 31, 2019	Deep LearningStochastic Optimization	CodeCode Available	1	5
JaxSGMC: Modular stochastic gradient MCMC in JAX	May 16, 2025	Deep LearningStochastic Optimization	CodeCode Available	1	5
Averaging Weights Leads to Wider Optima and Better Generalization	Mar 14, 2018	Image ClassificationStochastic Optimization	CodeCode Available	1	5
ADAHESSIAN: An Adaptive Second Order Optimizer for Machine Learning	Jun 1, 2020	BIG-bench Machine LearningSecond-order methods	CodeCode Available	1	5
PACOH: Bayes-Optimal Meta-Learning with PAC-Guarantees	Feb 13, 2020	Gaussian ProcessesGeneralization Bounds	CodeCode Available	1	5
Adam: A Method for Stochastic Optimization	Dec 22, 2014	Stochastic Optimization	CodeCode Available	1	5
BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery	Dec 6, 2021	Causal DiscoveryStochastic Optimization	CodeCode Available	1	5
Bi-level Score Matching for Learning Energy-based Latent Variable Models	Oct 15, 2020	Rolling Shutter CorrectionStochastic Optimization	CodeCode Available	1	5
Quality-Diversity Optimization: a novel branch of stochastic optimization	Dec 8, 2020	DiversityStochastic Optimization	CodeCode Available	1	5
BinaryViT: Pushing Binary Vision Transformers Towards Convolutional Models	Jun 29, 2023	BinarizationImage Classification	CodeCode Available	1	5
Randomized Physics-Informed Neural Networks for Bayesian Data Assimilation	Jul 5, 2024	Stochastic OptimizationUncertainty Quantification	CodeCode Available	1	5
Adapting to Mixing Time in Stochastic Optimization with Markovian Data	Feb 9, 2022	Stochastic Optimization	CodeCode Available	1	5
Reinforcement Learning with Dynamic Convex Risk Measures	Dec 26, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Shampoo: Preconditioned Stochastic Tensor Optimization	Feb 26, 2018	Stochastic Optimization	CodeCode Available	1	5
A Framework for Improving the Reliability of Black-box Variational Inference	Mar 29, 2022	Bayesian InferenceStochastic Optimization	CodeCode Available	1	5
Decentralized Stochastic Optimization and Gossip Algorithms with Compressed Communication	Feb 1, 2019	Stochastic Optimization	CodeCode Available	0	5
DADAM: A Consensus-based Distributed Adaptive Gradient Method for Online Optimization	Jan 25, 2019	Stochastic Optimization	CodeCode Available	0	5
Decision-Dependent Stochastic Optimization: The Role of Distribution Dynamics	Mar 10, 2025	Recommendation SystemsStochastic Optimization	CodeCode Available	0	5
ACMo: Angle-Calibrated Moment Methods for Stochastic Optimization	Jun 12, 2020	BIG-bench Machine LearningStochastic Optimization	CodeCode Available	0	5
CProp: Adaptive Learning Rate Scaling from Past Gradient Conformity	Dec 24, 2019	SchedulingStochastic Optimization	CodeCode Available	0	5
Coupling Adaptive Batch Sizes with Learning Rates	Dec 15, 2016	image-classificationImage Classification	CodeCode Available	0	5

Show:10 25 50

← PrevPage 2 of 28Next →

All datasets CIFAR-100 WRN-28-10 - 200 Epochs CIFAR-10 WRN-28-10 - 200 Epochs CIFAR-10 ResNet-18 - 200 Epochs ImageNet ResNet-50 - 90 Epochs Penn Treebank (Character Level) 3x1000 LSTM - 500 Epochs CIFAR-10 CIFAR-100 ImageNet ResNet-50 - 50 Epochs ImageNet ResNet-50 - 60 Epochs AG News CoLA MNIST

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AvaGrad	Accuracy	81.24	—	Unverified
2	AdaShift	Accuracy	81.12	—	Unverified
3	Adam (eps-adjusted)	Accuracy	81.04	—	Unverified
4	SGD	Accuracy	80.95	—	Unverified
5	AdamW	Accuracy	79.87	—	Unverified
6	AdaBound	Accuracy	77.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Adam (eps-adjusted)	Accuracy	96.36	—	Unverified
2	AvaGrad	Accuracy	96.2	—	Unverified
3	SGD	Accuracy	96.14	—	Unverified
4	AdaShift	Accuracy	95.92	—	Unverified
5	AdamW	Accuracy	95.89	—	Unverified
6	AdaBound	Accuracy	94.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGD - cosine LR schedule	Accuracy	95.55	—	Unverified
2	Lookahead	Accuracy	95.27	—	Unverified
3	SGD	Accuracy	95.23	—	Unverified
4	ADAM	Accuracy	94.84	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AvaGrad	Top 1 Accuracy	76.51	—	Unverified
2	SGD	Top 1 Accuracy	75.99	—	Unverified
3	AdamW	Top 1 Accuracy	72.9	—	Unverified
4	AdaBound	Top 1 Accuracy	72.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaBound	Bit per Character (BPC)	2.86	—	Unverified
2	AdaShift	Bit per Character (BPC)	1.27	—	Unverified
3	AdamW	Bit per Character (BPC)	1.23	—	Unverified
4	AvaGrad	Bit per Character (BPC)	1.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Resnet18	Accuracy (max)	86.85	—	Unverified
2	Resnet34	Accuracy (max)	86.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Resnet18	Accuracy (max)	58.48	—	Unverified
2	Resnet34	Accuracy (max)	54.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGD	Top 5 Accuracy	92.15	—	Unverified
2	Lookahead	Top 1 Accuracy	75.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lookahead	Top 1 Accuracy	75.49	—	Unverified
2	SGD	Top 1 Accuracy	75.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Bert	Accuracy (max)	93.99	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Bert	Accuracy (max)	86.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MLP	NLL	0.05	—	Unverified