Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 382 papers

Title	Date	Tasks	Status	Hype
Learning Decentralized Partially Observable Mean Field Control for Artificial Collective Behavior	Jul 12, 2023	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Provably Convergent Policy Optimization via Metric-aware Trust Region Methods	Jun 25, 2023	continuous-controlContinuous Control	—Unverified	0
Correcting discount-factor mismatch in on-policy policy gradient methods	Jun 23, 2023	OpenAI GymPolicy Gradient Methods	—Unverified	0
Neural Inventory Control in Networks via Hindsight Differentiable Policy Optimization	Jun 20, 2023	Deep Reinforcement LearningManagement	CodeCode Available	1
Acceleration in Policy Optimization	Jun 18, 2023	Meta-LearningPolicy Gradient Methods	—Unverified	0
Deep Policy Gradient Methods in Commodity Markets	Jun 14, 2023	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Stepsize Learning for Policy Gradient Methods in Contextual Markov Decision Processes	Jun 13, 2023	Meta Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation	Jun 9, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Efficient Diffusion Policies for Offline Reinforcement Learning	May 31, 2023	D4RLOffline RL	CodeCode Available	1
Solving Robust MDPs through No-Regret Dynamics	May 30, 2023	NavigatePolicy Gradient Methods	—Unverified	0
Adaptive Policy Learning to Additional Tasks	May 24, 2023	Policy Gradient Methods	—Unverified	0
Shattering the Agent-Environment Interface for Fine-Tuning Inclusive Language Models	May 19, 2023	Efficient ExplorationLanguage Modeling	—Unverified	0
Client Selection for Federated Policy Optimization with Environment Heterogeneity	May 18, 2023	MuJoCoPolicy Gradient Methods	CodeCode Available	0
Policy Gradient Methods in the Presence of Symmetries and State Abstractions	May 9, 2023	continuous-controlContinuous Control	CodeCode Available	1
Online Portfolio Management via Deep Reinforcement Learning with High-Frequency Data	May 1, 2023	Deep Reinforcement LearningManagement	CodeCode Available	1
Policy Gradient Methods for Discrete Time Linear Quadratic Regulator With Random Parameters	Mar 29, 2023	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Policy Mirror Descent Inherently Explores Action Space	Mar 8, 2023	Efficient ExplorationGeneral Reinforcement Learning	—Unverified	0
Policy gradient learning methods for stochastic control with exit time and applications to share repurchase pricing	Feb 14, 2023	Policy Gradient Methods	—Unverified	0
A Policy Gradient Framework for Stochastic Optimal Control Problems with Global Convergence Guarantee	Feb 11, 2023	Policy Gradient Methods	—Unverified	0
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Stochastic Policy Gradient Methods: Improved Sample Complexity for Fisher-non-degenerate Policies	Feb 3, 2023	Policy Gradient Methods	—Unverified	0
Accelerating Policy Gradient by Estimating Value Function from Prior Computation in Deep Reinforcement Learning	Feb 2, 2023	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Policy Gradient for Rectangular Robust Markov Decision Processes	Jan 31, 2023	FormPolicy Gradient Methods	—Unverified	0
SoftTreeMax: Exponential Variance Reduction in Policy Gradient via Tree Search	Jan 30, 2023	GPUPolicy Gradient Methods	—Unverified	0
Stochastic Dimension-reduced Second-order Methods for Policy Optimization	Jan 28, 2023	Policy Gradient MethodsSecond-order methods	—Unverified	0

Show:10 25 50

← PrevPage 5 of 16Next →

No leaderboard results yet.