Stochastic Optimization

Stochastic Optimization is the task of optimizing certain objective functional by generating and using stochastic random variables. Usually the Stochastic Optimization is an iterative process of generating random variables that progressively finds out the minima or the maxima of the objective functional. Stochastic Optimization is usually applied in the non-convex functional spaces where the usual deterministic optimization such as linear or quadratic programming or their variants cannot be used.

Source: ASOC: An Adaptive Parameter-free Stochastic Optimization Techinique for Continuous Variables

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 1387 papers

Title	Date	Tasks	Status	Hype
SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning	Apr 28, 2024	Stochastic Optimization	CodeCode Available	1
Spectral Inference Networks: Unifying Deep and Spectral Learning	Jun 6, 2018	Atari GamesBilevel Optimization	CodeCode Available	1
A Variational Perspective on Solving Inverse Problems with Diffusion Models	May 7, 2023	DenoisingImage Restoration	CodeCode Available	1
Stochastic Gradient Descent Captures How Children Learn About Physics	Sep 25, 2022	Stochastic Optimization	CodeCode Available	1
An Analysis of the Adaptation Speed of Causal Models	May 18, 2020	Meta-LearningStochastic Optimization	CodeCode Available	1
Stochastic Optimization for Performative Prediction	Jun 12, 2020	PredictionStochastic Optimization	CodeCode Available	1
The Acquisition of Physical Knowledge in Generative Neural Networks	Oct 30, 2023	Stochastic Optimization	CodeCode Available	1
Time-Causal VAE: Robust Financial Time Series Generator	Nov 5, 2024	DecoderStochastic Optimization	CodeCode Available	1
Adaptive Semantic Token Communication for Transformer-based Edge Inference	May 23, 2025	object-detectionObject Detection	CodeCode Available	1
Variational Inference: A Review for Statisticians	Jan 4, 2016	Stochastic OptimizationVariational Inference	CodeCode Available	1
Why Do We Need Weight Decay in Modern Deep Learning?	Oct 6, 2023	Deep Learningimage-classification	CodeCode Available	1
A Better Alternative to Error Feedback for Communication-Efficient Distributed Learning	Jun 19, 2020	Federated LearningStochastic Optimization	CodeCode Available	1
A Novel Unified Parametric Assumption for Nonconvex Optimization	Feb 17, 2025	Stochastic Optimization	CodeCode Available	1
Averaging Weights Leads to Wider Optima and Better Generalization	Mar 14, 2018	Image ClassificationStochastic Optimization	CodeCode Available	1
Apollo: An Adaptive Parameter-wise Diagonal Quasi-Newton Method for Nonconvex Stochastic Optimization	Sep 28, 2020	Stochastic Optimization	CodeCode Available	1
ATD: Augmenting CP Tensor Decomposition by Self Supervision	Jun 15, 2021	Data AugmentationDimensionality Reduction	CodeCode Available	1
Cyclical Stochastic Gradient MCMC for Bayesian Deep Learning	Feb 11, 2019	Bayesian InferenceDeep Learning	CodeCode Available	1
Learning from History for Byzantine Robust Optimization	Dec 18, 2020	Federated LearningStochastic Optimization	CodeCode Available	1
BinaryViT: Pushing Binary Vision Transformers Towards Convolutional Models	Jun 29, 2023	BinarizationImage Classification	CodeCode Available	1
Combinatorial Optimization enriched Machine Learning to solve the Dynamic Vehicle Routing Problem with Time Windows	Apr 3, 2023	Combinatorial OptimizationStochastic Optimization	CodeCode Available	1
Adaptivity of Stochastic Gradient Methods for Nonconvex Optimization	Feb 13, 2020	Stochastic Optimization	CodeCode Available	1
Adaptivity without Compromise: A Momentumized, Adaptive, Dual Averaged Gradient Method for Stochastic Optimization	Jan 26, 2021	Stochastic Optimization	CodeCode Available	1
Deep Generalized Canonical Correlation Analysis	Feb 8, 2017	Representation LearningStochastic Optimization	CodeCode Available	1
Self-Directed Online Machine Learning for Topology Optimization	Feb 4, 2020	BIG-bench Machine LearningStochastic Optimization	CodeCode Available	1
Distributionally Robust Neural Networks for Group Shifts: On the Importance of Regularization for Worst-Case Generalization	Nov 20, 2019	Domain GeneralizationNatural Language Inference	CodeCode Available	1
Efficient approximation of Jacobian matrices involving a non-uniform fast Fourier transform (NUFFT)	Nov 4, 2021	compressed sensingImage Reconstruction	CodeCode Available	1
Exploiting Explainable Metrics for Augmented SGD	Mar 31, 2022	Stochastic Optimization	CodeCode Available	1
Federated Learning over Wireless Networks: Convergence Analysis and Resource Allocation	Oct 29, 2019	Federated LearningPrivacy Preserving	CodeCode Available	1
Adafactor: Adaptive Learning Rates with Sublinear Memory Cost	Apr 11, 2018	Machine TranslationStochastic Optimization	CodeCode Available	1
ADMM for Efficient Deep Learning with Global Convergence	May 31, 2019	Deep LearningStochastic Optimization	CodeCode Available	1
Revisiting Distributed Synchronous SGD	Apr 4, 2016	Stochastic Optimization	CodeCode Available	1
Lookahead Optimizer: k steps forward, 1 step back	Jul 19, 2019	Image ClassificationMachine Translation	CodeCode Available	1
ADAHESSIAN: An Adaptive Second Order Optimizer for Machine Learning	Jun 1, 2020	BIG-bench Machine LearningSecond-order methods	CodeCode Available	1
Monte Carlo Policy Gradient Method for Binary Optimization	Jul 3, 2023	Combinatorial OptimizationDiversity	CodeCode Available	1
Adam: A Method for Stochastic Optimization	Dec 22, 2014	Stochastic Optimization	CodeCode Available	1
Online Learning Rate Adaptation with Hypergradient Descent	Mar 14, 2017	Hyperparameter OptimizationStochastic Optimization	CodeCode Available	1
ORL: Reinforcement Learning Benchmarks for Online Stochastic Optimization Problems	Nov 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
PACOH: Bayes-Optimal Meta-Learning with PAC-Guarantees	Feb 13, 2020	Gaussian ProcessesGeneralization Bounds	CodeCode Available	1
Personalized Federated Learning with Moreau Envelopes	Jun 16, 2020	DiversityFederated Learning	CodeCode Available	1
Sequential Manipulation Planning on Scene Graph	Jul 10, 2022	Object RearrangementStochastic Optimization	CodeCode Available	1
Adapting to Mixing Time in Stochastic Optimization with Markovian Data	Feb 9, 2022	Stochastic Optimization	CodeCode Available	1
Provable Stochastic Optimization for Global Contrastive Learning: Small Batch Does Not Harm Performance	Feb 24, 2022	Contrastive LearningSelf-Supervised Learning	CodeCode Available	1
Quality-Diversity Optimization: a novel branch of stochastic optimization	Dec 8, 2020	DiversityStochastic Optimization	CodeCode Available	1
Randomized Automatic Differentiation	Jul 20, 2020	Stochastic OptimizationVariational Inference	CodeCode Available	1
Adaptive Single-Pass Stochastic Gradient Descent in Input Sparsity Time	Jan 1, 2021	Second-order methodsStochastic Optimization	—Unverified	0
Adaptive Shells for Efficient Neural Radiance Field Rendering	Nov 16, 2023	Novel View SynthesisStochastic Optimization	—Unverified	0
A Communication-Efficient Adaptive Algorithm for Federated Learning under Cumulative Regret	Jan 21, 2023	Federated LearningStochastic Optimization	—Unverified	0
Adaptive Sequential Machine Learning	Apr 4, 2019	BIG-bench Machine LearningModel Selection	—Unverified	0
Accelerated Reinforcement Learning	Oct 23, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified	0
A Latent Variational Framework for Stochastic Optimization	May 5, 2019	Bayesian InferenceStochastic Optimization	—Unverified	0

Show:10 25 50

← PrevPage 2 of 28Next →

All datasets CIFAR-100 WRN-28-10 - 200 Epochs CIFAR-10 WRN-28-10 - 200 Epochs CIFAR-10 ResNet-18 - 200 Epochs ImageNet ResNet-50 - 90 Epochs Penn Treebank (Character Level) 3x1000 LSTM - 500 Epochs CIFAR-10 CIFAR-100 ImageNet ResNet-50 - 50 Epochs ImageNet ResNet-50 - 60 Epochs AG News CoLA MNIST

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AvaGrad	Accuracy	81.24	—	Unverified
2	AdaShift	Accuracy	81.12	—	Unverified
3	Adam (eps-adjusted)	Accuracy	81.04	—	Unverified
4	SGD	Accuracy	80.95	—	Unverified
5	AdamW	Accuracy	79.87	—	Unverified
6	AdaBound	Accuracy	77.24	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Adam (eps-adjusted)	Accuracy	96.36	—	Unverified
2	AvaGrad	Accuracy	96.2	—	Unverified
3	SGD	Accuracy	96.14	—	Unverified
4	AdaShift	Accuracy	95.92	—	Unverified
5	AdamW	Accuracy	95.89	—	Unverified
6	AdaBound	Accuracy	94.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGD - cosine LR schedule	Accuracy	95.55	—	Unverified
2	Lookahead	Accuracy	95.27	—	Unverified
3	SGD	Accuracy	95.23	—	Unverified
4	ADAM	Accuracy	94.84	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AvaGrad	Top 1 Accuracy	76.51	—	Unverified
2	SGD	Top 1 Accuracy	75.99	—	Unverified
3	AdamW	Top 1 Accuracy	72.9	—	Unverified
4	AdaBound	Top 1 Accuracy	72.01	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	AdaBound	Bit per Character (BPC)	2.86	—	Unverified
2	AdaShift	Bit per Character (BPC)	1.27	—	Unverified
3	AdamW	Bit per Character (BPC)	1.23	—	Unverified
4	AvaGrad	Bit per Character (BPC)	1.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Resnet18	Accuracy (max)	86.85	—	Unverified
2	Resnet34	Accuracy (max)	86.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Resnet18	Accuracy (max)	58.48	—	Unverified
2	Resnet34	Accuracy (max)	54.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SGD	Top 5 Accuracy	92.15	—	Unverified
2	Lookahead	Top 1 Accuracy	75.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Lookahead	Top 1 Accuracy	75.49	—	Unverified
2	SGD	Top 1 Accuracy	75.15	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Bert	Accuracy (max)	93.99	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Bert	Accuracy (max)	86.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MLP	NLL	0.05	—	Unverified