Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 226–250 of 382 papers

Title	Date	Tasks	Status
PGPS : Coupling Policy Gradient with Population-based Search	Jan 1, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Incremental Policy Gradients for Online Reinforcement Learning Control	Jan 1, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Self-Supervised Continuous Control without Policy Gradient	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
2D or not 2D? Adaptive 3D Convolution Selection for Efficient Video Recognition	Dec 29, 2020	Action RecognitionPolicy Gradient Methods	—Unverified
Difference Rewards Policy Gradients	Dec 21, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified
Model-free and Bayesian Ensembling Model-based Deep Reinforcement Learning for Particle Accelerator Control Demonstrated on the FERMI FEL	Dec 17, 2020	Deep Reinforcement Learningmodel	CodeCode Available
Sample Complexity of Policy Gradient Finding Second-Order Stationary Points	Dec 2, 2020	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Reinforcement Learning in Linear Quadratic Deep Structured Teams: Global Convergence of Policy Gradient Methods	Nov 29, 2020	Policy Gradient Methods	—Unverified
Policy Optimization for Markovian Jump Linear Quadratic Control: Gradient-Based Methods and Global Convergence	Nov 24, 2020	Policy Gradient Methods	—Unverified
Policy Gradient Methods for the Noisy Linear Quadratic Regulator over a Finite Horizon	Nov 20, 2020	Policy Gradient Methods	—Unverified
Optimal Control-Based Baseline for Guided Exploration in Policy Gradient Methods	Nov 4, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
A Study of Policy Gradient on a Class of Exactly Solvable Models	Nov 3, 2020	Policy Gradient Methods	—Unverified
Batch Reinforcement Learning with a Nonparametric Off-Policy Policy Gradient	Oct 27, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Sample Efficient Reinforcement Learning with REINFORCE	Oct 22, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Rethinking Deep Policy Gradients via State-Wise Policy Improvement	Oct 19, 2020	Policy Gradient MethodsValue prediction	—Unverified
Evolutionary Selective Imitation: Interpretable Agents by Imitation Learning Without a Demonstrator	Sep 17, 2020	Imitation LearningOpenAI Gym	—Unverified
Approximation Benefits of Policy Gradient Methods with Aggregated States	Jul 22, 2020	Policy Gradient Methods	—Unverified
On Linear Convergence of Policy Gradient Methods for Finite MDPs	Jul 21, 2020	Policy Gradient Methods	—Unverified
PC-PG: Policy Cover Directed Exploration for Provable Policy Gradient Learning	Jul 16, 2020	Policy Gradient MethodsQ-Learning	CodeCode Available
Fast Global Convergence of Natural Policy Gradient Methods with Entropy Regularization	Jul 13, 2020	Policy Gradient Methods	—Unverified
Momentum-Based Policy Gradient Methods	Jul 13, 2020	Policy Gradient Methods	CodeCode Available
Policy Gradient Optimization of Thompson Sampling Policies	Jun 30, 2020	Policy Gradient MethodsThompson Sampling	—Unverified
An operator view of policy gradient methods	Jun 19, 2020	Policy Gradient Methods	—Unverified
Lifelong Learning of Factored Policies via Policy Gradients	Jun 12, 2020	continuous-controlContinuous Control	—Unverified
Zeroth-Order Supervised Policy Improvement	Jun 11, 2020	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 10 of 16Next →

No leaderboard results yet.