Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 382 papers

Title	Date	Tasks	Status	Hype
Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning	May 31, 2021	Learning TheoryMulti-agent Reinforcement Learning	—Unverified	0
Meta Learning the Step Size in Policy Gradient Methods	May 20, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Controlling an Inverted Pendulum with Policy Gradient Methods-A Tutorial	May 17, 2021	OpenAI GymPolicy Gradient Methods	—Unverified	0
On the Linear convergence of Natural Policy Gradient Algorithm	May 4, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Semi-On-Policy Training for Sample Efficient Multi-Agent Policy Gradients	Apr 27, 2021	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Model-free Policy Learning with Reward Gradients	Mar 9, 2021	Continuous Controlmodel	CodeCode Available	1
Softmax Policy Gradient Methods Can Take Exponential Time to Converge	Feb 22, 2021	Policy Gradient Methods	—Unverified	0
Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPs	Feb 20, 2021	Policy Gradient Methods	—Unverified	0
Strategic bidding in freight transport using deep reinforcement learning	Feb 18, 2021	Deep Reinforcement LearningFairness	—Unverified	0
Provably Efficient Policy Optimization for Two-Player Zero-Sum Markov Games	Feb 17, 2021	Policy Gradient MethodsVocal Bursts Valence Prediction	—Unverified	0
Independent Policy Gradient Methods for Competitive Reinforcement Learning	Jan 11, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Self-Supervised Continuous Control without Policy Gradient	Jan 1, 2021	continuous-controlContinuous Control	—Unverified	0
Incremental Policy Gradients for Online Reinforcement Learning Control	Jan 1, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified	0
PGPS : Coupling Policy Gradient with Population-based Search	Jan 1, 2021	Deep Reinforcement LearningMuJoCo	—Unverified	0
2D or not 2D? Adaptive 3D Convolution Selection for Efficient Video Recognition	Dec 29, 2020	Action RecognitionPolicy Gradient Methods	—Unverified	0
Difference Rewards Policy Gradients	Dec 21, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
Model-free and Bayesian Ensembling Model-based Deep Reinforcement Learning for Particle Accelerator Control Demonstrated on the FERMI FEL	Dec 17, 2020	Deep Reinforcement Learningmodel	CodeCode Available	0
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1
Sample Complexity of Policy Gradient Finding Second-Order Stationary Points	Dec 2, 2020	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Learning Multi-Agent Communication through Structured Attentive Reasoning	Dec 1, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Reinforcement Learning in Linear Quadratic Deep Structured Teams: Global Convergence of Policy Gradient Methods	Nov 29, 2020	Policy Gradient Methods	—Unverified	0
Policy Optimization for Markovian Jump Linear Quadratic Control: Gradient-Based Methods and Global Convergence	Nov 24, 2020	Policy Gradient Methods	—Unverified	0
Policy Gradient Methods for the Noisy Linear Quadratic Regulator over a Finite Horizon	Nov 20, 2020	Policy Gradient Methods	—Unverified	0
Optimal Control-Based Baseline for Guided Exploration in Policy Gradient Methods	Nov 4, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
A Study of Policy Gradient on a Class of Exactly Solvable Models	Nov 3, 2020	Policy Gradient Methods	—Unverified	0
Experimental design for MRI by greedy policy search	Oct 30, 2020	Experimental DesignPolicy Gradient Methods	CodeCode Available	1
Batch Reinforcement Learning with a Nonparametric Off-Policy Policy Gradient	Oct 27, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Sample Efficient Reinforcement Learning with REINFORCE	Oct 22, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Rethinking Deep Policy Gradients via State-Wise Policy Improvement	Oct 19, 2020	Policy Gradient MethodsValue prediction	—Unverified	0
Efficient Wasserstein Natural Gradients for Reinforcement Learning	Oct 12, 2020	Policy Gradient Methodsreinforcement-learning	CodeCode Available	1
Evolutionary Selective Imitation: Interpretable Agents by Imitation Learning Without a Demonstrator	Sep 17, 2020	Imitation LearningOpenAI Gym	—Unverified	0
Approximation Benefits of Policy Gradient Methods with Aggregated States	Jul 22, 2020	Policy Gradient Methods	—Unverified	0
On Linear Convergence of Policy Gradient Methods for Finite MDPs	Jul 21, 2020	Policy Gradient Methods	—Unverified	0
PC-PG: Policy Cover Directed Exploration for Provable Policy Gradient Learning	Jul 16, 2020	Policy Gradient MethodsQ-Learning	CodeCode Available	0
Lifelong Policy Gradient Learning of Factored Policies for Faster Training Without Forgetting	Jul 14, 2020	Lifelong learningPolicy Gradient Methods	CodeCode Available	1
Fast Global Convergence of Natural Policy Gradient Methods with Entropy Regularization	Jul 13, 2020	Policy Gradient Methods	—Unverified	0
Momentum-Based Policy Gradient Methods	Jul 13, 2020	Policy Gradient Methods	CodeCode Available	0
Policy Gradient Optimization of Thompson Sampling Policies	Jun 30, 2020	Policy Gradient MethodsThompson Sampling	—Unverified	0
Deep Bayesian Quadrature Policy Optimization	Jun 28, 2020	continuous-controlContinuous Control	CodeCode Available	1
An operator view of policy gradient methods	Jun 19, 2020	Policy Gradient Methods	—Unverified	0
Competitive Policy Optimization	Jun 18, 2020	Policy Gradient Methods	CodeCode Available	1
Lifelong Learning of Factored Policies via Policy Gradients	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
Zeroth-Order Supervised Policy Improvement	Jun 11, 2020	continuous-controlContinuous Control	—Unverified	0
Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent	Jun 2, 2020	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Invariant Policy Optimization: Towards Stronger Generalization in Reinforcement Learning	Jun 1, 2020	Policy Gradient Methodsreinforcement-learning	CodeCode Available	1
On the Global Convergence Rates of Softmax Policy Gradient Methods	May 13, 2020	Open-Ended Question AnsweringPolicy Gradient Methods	—Unverified	0
Improving Sample Efficiency and Multi-Agent Communication in RL-based Train Rescheduling	Apr 28, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Safe Reinforcement Learning via Projection on a Safe Set: How to Achieve Optimality?	Apr 2, 2020	Policy Gradient MethodsQ-Learning	—Unverified	0
Exchangeable Input Representations for Reinforcement Learning	Mar 19, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Stochastic Recursive Momentum for Policy Gradient Methods	Mar 9, 2020	Policy Gradient Methods	—Unverified	0

Show:10 25 50

← PrevPage 5 of 8Next →

No leaderboard results yet.