Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 326–350 of 382 papers

Title	Date	Tasks	Status
BOTS: Batch Bayesian Optimization of Extended Thompson Sampling for Severely Episode-Limited RL Settings	Nov 30, 2024	Bayesian OptimizationPolicy Gradient Methods	—Unverified
CaLcs: Continuously Approximating Longest Common Subsequence for Sequence Level Optimization	Oct 1, 2018	Abstractive Text SummarizationImage Captioning	—Unverified
Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPs	Feb 20, 2021	Policy Gradient Methods	—Unverified
Commodities Trading through Deep Policy Gradient Methods	Aug 10, 2023	Algorithmic TradingDeep Reinforcement Learning	—Unverified
Communication-Efficient Policy Gradient Methods for Distributed Reinforcement Learning	Dec 7, 2018	Distributed ComputingMulti-agent Reinforcement Learning	—Unverified
Computing and Learning Stationary Mean Field Equilibria with Scalar Interactions: Algorithms and Applications	Feb 2, 2025	counterfactualPolicy Gradient Methods	—Unverified
Controlling an Inverted Pendulum with Policy Gradient Methods-A Tutorial	May 17, 2021	OpenAI GymPolicy Gradient Methods	—Unverified
Control randomisation approach for policy gradient and application to reinforcement learning in optimal switching	Apr 27, 2024	Policy Gradient Methods	—Unverified
Convergence and Optimality of Policy Gradient Methods in Weakly Smooth Settings	Oct 30, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Convergence and Price of Anarchy Guarantees of the Softmax Policy Gradient in Markov Potential Games	Jun 15, 2022	Policy Gradient Methods	—Unverified
Convergence of policy gradient methods for finite-horizon exploratory linear-quadratic control problems	Nov 1, 2022	Policy Gradient Methods	—Unverified
Correcting discount-factor mismatch in on-policy policy gradient methods	Jun 23, 2023	OpenAI GymPolicy Gradient Methods	—Unverified
Countering Language Drift via Grounding	Sep 27, 2018	Language ModelingLanguage Modelling	—Unverified
Curious Explorer: a provable exploration strategy in Policy Learning	Jun 29, 2021	Policy Gradient Methods	—Unverified
Current applications and potential future directions of reinforcement learning-based Digital Twins in agriculture	Jun 13, 2024	Decision MakingManagement	—Unverified
DeepGait: Planning and Control of Quadrupedal Gaits using Deep Reinforcement Learning	Sep 18, 2019	Deep Reinforcement LearningMotion Planning	—Unverified
Deep Policy Gradient Methods in Commodity Markets	Jun 14, 2023	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Deep Reinforcement Learning based Blind mmWave MIMO Beam Alignment	Jan 25, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Deterministic Policy Gradient Primal-Dual Methods for Continuous-Space Constrained MDPs	Aug 19, 2024	continuous-controlContinuous Control	—Unverified
Difference Rewards Policy Gradients	Dec 21, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified
Diverse Exploration via Conjugate Policies for Policy Gradient Methods	Feb 10, 2019	Policy Gradient Methods	—Unverified
Efficient Baseline-free Sampling in Parameter Exploring Policy Gradients: Super Symmetric PGPE	Dec 13, 2013	Policy Gradient Methods	—Unverified
Reinforcement Learning for Causal Discovery without Acyclicity Constraints	Aug 24, 2024	Causal DiscoveryEfficient Exploration	—Unverified
Efficient Wasserstein and Sinkhorn Policy Optimization	Sep 29, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Elementary Analysis of Policy Gradient Methods	Apr 4, 2024	Policy Gradient Methods	—Unverified

Show:10 25 50

← PrevPage 14 of 16Next →

No leaderboard results yet.