Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–275 of 382 papers

Title	Date	Tasks	Status
Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent	Jun 2, 2020	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
On the Global Convergence Rates of Softmax Policy Gradient Methods	May 13, 2020	Open-Ended Question AnsweringPolicy Gradient Methods	—Unverified
Improving Sample Efficiency and Multi-Agent Communication in RL-based Train Rescheduling	Apr 28, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Safe Reinforcement Learning via Projection on a Safe Set: How to Achieve Optimality?	Apr 2, 2020	Policy Gradient MethodsQ-Learning	—Unverified
Exchangeable Input Representations for Reinforcement Learning	Mar 19, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Stochastic Recursive Momentum for Policy Gradient Methods	Mar 9, 2020	Policy Gradient Methods	—Unverified
Policy-Aware Model Learning for Policy Gradient Methods	Feb 28, 2020	modelModel-based Reinforcement Learning	CodeCode Available
GACEM: Generalized Autoregressive Cross Entropy Method for Multi-Modal Black Box Constraint Satisfaction	Feb 17, 2020	Policy Gradient MethodsReinforcement Learning	—Unverified
On the Convergence Theory of Debiased Model-Agnostic Meta-Reinforcement Learning	Feb 12, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available
Statistically Efficient Off-Policy Policy Gradients	Feb 10, 2020	Policy Gradient MethodsReinforcement Learning	—Unverified
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified
Neural MMO v1.3: A Massively Multiagent Game Environment for Training and Evaluating Neural Networks	Jan 31, 2020	Policy Gradient MethodsReinforcement Learning	—Unverified
Deep Reinforcement Learning based Blind mmWave MIMO Beam Alignment	Jan 25, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
A Nonparametric Off-Policy Policy Gradient	Jan 8, 2020	Density EstimationPolicy Gradient Methods	CodeCode Available
Entropy Regularization with Discounted Future State Distribution in Policy Gradient Methods	Dec 11, 2019	Policy Gradient Methods	—Unverified
Fast Efficient Hyperparameter Tuning for Policy Gradient Methods	Dec 1, 2019	Policy Gradient Methods	CodeCode Available
Optimal Resource Allocation in Wireless Control Systems via Deep Policy Gradient	Oct 25, 2019	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Policy Optimization for H_2 Linear Control with H_ Robustness Guarantee: Implicit Regularization and Global Convergence	Oct 21, 2019	Policy Gradient MethodsReinforcement Learning	—Unverified
All-Action Policy Gradient Methods: A Numerical Integration Approach	Oct 21, 2019	Allcontinuous-control	—Unverified
Linear-Quadratic Mean-Field Reinforcement Learning: Convergence of Policy Gradient Methods	Oct 9, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
V-MPO: On-Policy Maximum a Posteriori Policy Optimization for Discrete and Continuous Control	Sep 26, 2019	continuous-controlContinuous Control	CodeCode Available
Guided Adaptive Credit Assignment for Sample Efficient Policy Optimization	Sep 25, 2019	Instruction FollowingPolicy Gradient Methods	—Unverified
Policy Tree Network	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Sample Efficient Policy Gradient Methods with Recursive Variance Reduction	Sep 18, 2019	Policy Gradient Methodsreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 11 of 16Next →

No leaderboard results yet.