Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 382 papers

Title	Date	Tasks	Status
Evolution Strategies as an Alternate Learning method for Hierarchical Reinforcement Learning	Sep 29, 2021	Hierarchical Reinforcement LearningPolicy Gradient Methods	—Unverified
Asynchronous Multi-Agent Actor-Critic with Macro-Actions	Sep 29, 2021	Decision MakingPolicy Gradient Methods	—Unverified
Theoretical Guarantees of Fictitious Discount Algorithms for Episodic Reinforcement Learning and Global Convergence of Policy Gradient Methods	Sep 13, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
A general class of surrogate functions for stable and efficient reinforcement learning	Aug 12, 2021	MuJoCoPolicy Gradient Methods	CodeCode Available
Value-Based Reinforcement Learning for Continuous Control Robotic Manipulation in Multi-Task Sparse Reward Settings	Jul 28, 2021	continuous-controlContinuous Control	—Unverified
Policy Gradient Methods Find the Nash Equilibrium in N-player General-sum Linear-quadratic Games	Jul 27, 2021	Policy Gradient Methods	—Unverified
Hindsight Value Function for Variance Reduction in Stochastic Dynamic Environment	Jul 26, 2021	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Proximal Policy Optimization for Tracking Control Exploiting Future Reference Information	Jul 20, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Greedification Operators for Policy Optimization: Investigating Forward and Reverse KL Divergences	Jul 17, 2021	Policy Gradient Methods	—Unverified
Fine-Grained AutoAugmentation for Multi-Label Classification	Jul 12, 2021	ClassificationData Augmentation	—Unverified
Policy Gradient Methods for Distortion Risk Measures	Jul 9, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Curious Explorer: a provable exploration strategy in Policy Learning	Jun 29, 2021	Policy Gradient Methods	—Unverified
Modularity in Reinforcement Learning via Algorithmic Independence in Credit Assignment	Jun 28, 2021	Decision MakingPolicy Gradient Methods	—Unverified
End-to-End Neuro-Symbolic Architecture for Image-to-Image Reasoning Tasks	Jun 6, 2021	Image ReconstructionPolicy Gradient Methods	—Unverified
Ad Headline Generation using Self-Critical Masked Language Model	Jun 1, 2021	Headline GenerationLanguage Modeling	—Unverified
Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning	May 31, 2021	Learning TheoryMulti-agent Reinforcement Learning	—Unverified
Meta Learning the Step Size in Policy Gradient Methods	May 20, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Controlling an Inverted Pendulum with Policy Gradient Methods-A Tutorial	May 17, 2021	OpenAI GymPolicy Gradient Methods	—Unverified
On the Linear convergence of Natural Policy Gradient Algorithm	May 4, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Semi-On-Policy Training for Sample Efficient Multi-Agent Policy Gradients	Apr 27, 2021	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Softmax Policy Gradient Methods Can Take Exponential Time to Converge	Feb 22, 2021	Policy Gradient Methods	—Unverified
Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPs	Feb 20, 2021	Policy Gradient Methods	—Unverified
Strategic bidding in freight transport using deep reinforcement learning	Feb 18, 2021	Deep Reinforcement LearningFairness	—Unverified
Provably Efficient Policy Optimization for Two-Player Zero-Sum Markov Games	Feb 17, 2021	Policy Gradient MethodsVocal Bursts Valence Prediction	—Unverified
Independent Policy Gradient Methods for Competitive Reinforcement Learning	Jan 11, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 9 of 16Next →

No leaderboard results yet.