Stochastic Optimization

Stochastic Optimization is the task of optimizing certain objective functional by generating and using stochastic random variables. Usually the Stochastic Optimization is an iterative process of generating random variables that progressively finds out the minima or the maxima of the objective functional. Stochastic Optimization is usually applied in the non-convex functional spaces where the usual deterministic optimization such as linear or quadratic programming or their variants cannot be used.

Source: ASOC: An Adaptive Parameter-free Stochastic Optimization Techinique for Continuous Variables

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1387 papers

Title	Date	Tasks	Status	Hype
MARS: Unleashing the Power of Variance Reduction for Training Large Models	Nov 15, 2024	Stochastic Optimization	CodeCode Available	4
Benchopt: Reproducible, efficient and collaborative optimization benchmarks	Jun 27, 2022	Benchmarkingimage-classification	CodeCode Available	4
Conformal Symplectic Optimization for Stable Reinforcement Learning	Dec 3, 2024	Atari GamesDeep Reinforcement Learning	CodeCode Available	2
Smoothing Methods for Automatic Differentiation Across Conditional Branches	Oct 5, 2023	Stochastic Optimization	CodeCode Available	2
Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training	May 23, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Riemannian Adaptive Optimization Methods	Oct 1, 2018	Riemannian optimizationStochastic Optimization	CodeCode Available	2
Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour	Jun 8, 2017	Stochastic Optimization	CodeCode Available	2
Adaptive Semantic Token Communication for Transformer-based Edge Inference	May 23, 2025	object-detectionObject Detection	CodeCode Available	1
JaxSGMC: Modular stochastic gradient MCMC in JAX	May 16, 2025	Deep LearningStochastic Optimization	CodeCode Available	1
A Novel Unified Parametric Assumption for Nonconvex Optimization	Feb 17, 2025	Stochastic Optimization	CodeCode Available	1
Time-Causal VAE: Robust Financial Time Series Generator	Nov 5, 2024	DecoderStochastic Optimization	CodeCode Available	1
Training-free Diffusion Model Alignment with Sampling Demons	Oct 8, 2024	DenoisingImage Generation	CodeCode Available	1
Randomized Physics-Informed Neural Networks for Bayesian Data Assimilation	Jul 5, 2024	Stochastic OptimizationUncertainty Quantification	CodeCode Available	1
SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning	Apr 28, 2024	Stochastic Optimization	CodeCode Available	1
The Acquisition of Physical Knowledge in Generative Neural Networks	Oct 30, 2023	Stochastic Optimization	CodeCode Available	1
Why Do We Need Weight Decay in Modern Deep Learning?	Oct 6, 2023	Deep Learningimage-classification	CodeCode Available	1
Monte Carlo Policy Gradient Method for Binary Optimization	Jul 3, 2023	Combinatorial OptimizationDiversity	CodeCode Available	1
BinaryViT: Pushing Binary Vision Transformers Towards Convolutional Models	Jun 29, 2023	BinarizationImage Classification	CodeCode Available	1
Neural Inventory Control in Networks via Hindsight Differentiable Policy Optimization	Jun 20, 2023	Deep Reinforcement LearningManagement	CodeCode Available	1
MoMo: Momentum Models for Adaptive Learning Rates	May 12, 2023	Recommendation SystemsStochastic Optimization	CodeCode Available	1
A Variational Perspective on Solving Inverse Problems with Diffusion Models	May 7, 2023	DenoisingImage Restoration	CodeCode Available	1
Decouple Graph Neural Networks: Train Multiple Simple GNNs Simultaneously Instead of One	Apr 20, 2023	Stochastic Optimization	CodeCode Available	1
Combinatorial Optimization enriched Machine Learning to solve the Dynamic Vehicle Routing Problem with Time Windows	Apr 3, 2023	Combinatorial OptimizationStochastic Optimization	CodeCode Available	1
Variational Linearized Laplace Approximation for Bayesian Deep Learning	Feb 24, 2023	Deep LearningStochastic Optimization	CodeCode Available	1
Optimal Planning of Hybrid Energy Storage Systems using Curtailed Renewable Energy through Deep Reinforcement Learning	Dec 12, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
End-to-End Stochastic Optimization with Energy-Based Model	Nov 25, 2022	SchedulingStochastic Optimization	CodeCode Available	1
Stochastic Gradient Descent Captures How Children Learn About Physics	Sep 25, 2022	Stochastic Optimization	CodeCode Available	1
Sequential Manipulation Planning on Scene Graph	Jul 10, 2022	Object RearrangementStochastic Optimization	CodeCode Available	1
Communication-Efficient Adaptive Federated Learning	May 5, 2022	Federated LearningQuantization	CodeCode Available	1
Exploiting Explainable Metrics for Augmented SGD	Mar 31, 2022	Stochastic Optimization	CodeCode Available	1
A Framework for Improving the Reliability of Black-box Variational Inference	Mar 29, 2022	Bayesian InferenceStochastic Optimization	CodeCode Available	1
Provable Stochastic Optimization for Global Contrastive Learning: Small Batch Does Not Harm Performance	Feb 24, 2022	Contrastive LearningSelf-Supervised Learning	CodeCode Available	1
Adapting to Mixing Time in Stochastic Optimization with Markovian Data	Feb 9, 2022	Stochastic Optimization	CodeCode Available	1
Reinforcement Learning with Dynamic Convex Risk Measures	Dec 26, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery	Dec 6, 2021	Causal DiscoveryStochastic Optimization	CodeCode Available	1
Efficient approximation of Jacobian matrices involving a non-uniform fast Fourier transform (NUFFT)	Nov 4, 2021	compressed sensingImage Reconstruction	CodeCode Available	1
slimTrain -- A Stochastic Approximation Method for Training Separable Deep Neural Networks	Sep 28, 2021	SensitivityStochastic Optimization	CodeCode Available	1
ATD: Augmenting CP Tensor Decomposition by Self Supervision	Jun 15, 2021	Data AugmentationDimensionality Reduction	CodeCode Available	1
Scaling Up Graph Neural Networks Via Graph Coarsening	Jun 9, 2021	Stochastic Optimization	CodeCode Available	1
Differentiable Quality Diversity	Jun 7, 2021	DiversityStochastic Optimization	CodeCode Available	1
Efficient Stochastic Optimal Control through Approximate Bayesian Input Inference	May 17, 2021	Stochastic Optimization	CodeCode Available	1
Stochastic Optimization of Areas Under Precision-Recall Curves with Provable Convergence	Apr 18, 2021	Stochastic Optimization	CodeCode Available	1
A Stochastic Optimization Framework for Fair Risk Minimization	Feb 24, 2021	Binary ClassificationFairness	CodeCode Available	1
Sinkhorn Label Allocation: Semi-Supervised Classification via Annealed Self-Training	Feb 17, 2021	ClassificationGeneral Classification	CodeCode Available	1
Parameter-free Stochastic Optimization of Variationally Coherent Functions	Jan 30, 2021	Stochastic Optimization	CodeCode Available	1
Adaptivity without Compromise: A Momentumized, Adaptive, Dual Averaged Gradient Method for Stochastic Optimization	Jan 26, 2021	Stochastic Optimization	CodeCode Available	1
LIRA: Learnable, Imperceptible and Robust Backdoor Attacks	Jan 1, 2021	Backdoor Attackbackdoor defense	CodeCode Available	1
Stochastic Gradient Variance Reduction by Solving a Filtering Problem	Dec 22, 2020	Stochastic Optimization	CodeCode Available	1
Learning from History for Byzantine Robust Optimization	Dec 18, 2020	Federated LearningStochastic Optimization	CodeCode Available	1
Quality-Diversity Optimization: a novel branch of stochastic optimization	Dec 8, 2020	DiversityStochastic Optimization	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 28Next →

All datasets CIFAR-100 WRN-28-10 - 200 Epochs CIFAR-10 WRN-28-10 - 200 Epochs CIFAR-10 ResNet-18 - 200 Epochs ImageNet ResNet-50 - 90 Epochs Penn Treebank (Character Level) 3x1000 LSTM - 500 Epochs CIFAR-10 CIFAR-100 ImageNet ResNet-50 - 50 Epochs ImageNet ResNet-50 - 60 Epochs AG News CoLA MNIST

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AvaGrad	Accuracy	81.24	—	Unverified
2	AdaShift	Accuracy	81.12	—	Unverified
3	Adam (eps-adjusted)	Accuracy	81.04	—	Unverified
4	SGD	Accuracy	80.95	—	Unverified
5	AdamW	Accuracy	79.87	—	Unverified
6	AdaBound	Accuracy	77.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Adam (eps-adjusted)	Accuracy	96.36	—	Unverified
2	AvaGrad	Accuracy	96.2	—	Unverified
3	SGD	Accuracy	96.14	—	Unverified
4	AdaShift	Accuracy	95.92	—	Unverified
5	AdamW	Accuracy	95.89	—	Unverified
6	AdaBound	Accuracy	94.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGD - cosine LR schedule	Accuracy	95.55	—	Unverified
2	Lookahead	Accuracy	95.27	—	Unverified
3	SGD	Accuracy	95.23	—	Unverified
4	ADAM	Accuracy	94.84	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AvaGrad	Top 1 Accuracy	76.51	—	Unverified
2	SGD	Top 1 Accuracy	75.99	—	Unverified
3	AdamW	Top 1 Accuracy	72.9	—	Unverified
4	AdaBound	Top 1 Accuracy	72.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaBound	Bit per Character (BPC)	2.86	—	Unverified
2	AdaShift	Bit per Character (BPC)	1.27	—	Unverified
3	AdamW	Bit per Character (BPC)	1.23	—	Unverified
4	AvaGrad	Bit per Character (BPC)	1.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Resnet18	Accuracy (max)	86.85	—	Unverified
2	Resnet34	Accuracy (max)	86.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Resnet18	Accuracy (max)	58.48	—	Unverified
2	Resnet34	Accuracy (max)	54.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGD	Top 5 Accuracy	92.15	—	Unverified
2	Lookahead	Top 1 Accuracy	75.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lookahead	Top 1 Accuracy	75.49	—	Unverified
2	SGD	Top 1 Accuracy	75.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Bert	Accuracy (max)	93.99	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Bert	Accuracy (max)	86.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MLP	NLL	0.05	—	Unverified