Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 382 papers

Title	Date	Tasks	Status	Hype
Rethinking Action Spaces for Reinforcement Learning in End-to-end Dialog Agents with Latent Variable Models	Feb 23, 2019	Decision MakingDialogue Generation	CodeCode Available	0
Fast Efficient Hyperparameter Tuning for Policy Gradients	Feb 18, 2019	Meta-LearningPolicy Gradient Methods	CodeCode Available	0
Diverse Exploration via Conjugate Policies for Policy Gradient Methods	Feb 10, 2019	Policy Gradient Methods	—Unverified	0
On-Policy Trust Region Policy Optimisation with Replay Buffers	Jan 18, 2019	Continuous ControlDeep Reinforcement Learning	CodeCode Available	0
Communication-Efficient Policy Gradient Methods for Distributed Reinforcement Learning	Dec 7, 2018	Distributed ComputingMulti-agent Reinforcement Learning	—Unverified	0
AdaFrame: Adaptive Frame Selection for Fast Video Recognition	Nov 29, 2018	Policy Gradient MethodsVideo Recognition	—Unverified	0
An Off-policy Policy Gradient Theorem Using Emphatic Weightings	Nov 22, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Reward-estimation variance elimination in sequential decision processes	Nov 15, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning	Nov 4, 2018	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1
Greedy Actor-Critic: A New Conditional Cross-Entropy Method for Policy Improvement	Oct 22, 2018	Policy Gradient MethodsQ-Learning	CodeCode Available	0
Risk-Sensitive Reinforcement Learning via Policy Gradient Search	Oct 22, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Policy Gradient in Partially Observable Environments: Approximation and Convergence	Oct 18, 2018	Decision MakingPolicy Gradient Methods	—Unverified	0
Where Did My Optimum Go?: An Empirical Analysis of Gradient Descent Optimization in Policy Gradient Methods	Oct 5, 2018	continuous-controlContinuous Control	CodeCode Available	0
CaLcs: Continuously Approximating Longest Common Subsequence for Sequence Level Optimization	Oct 1, 2018	Abstractive Text SummarizationImage Captioning	—Unverified	0
Training for Diversity in Image Paragraph Captioning	Oct 1, 2018	DiversityImage Captioning	CodeCode Available	0
Countering Language Drift via Grounding	Sep 27, 2018	Language ModelingLanguage Modelling	—Unverified	0
Assumption Questioning: Latent Copying and Reward Exploitation in Question Generation	Sep 27, 2018	Inductive BiasMachine Translation	—Unverified	0
The wisdom of the crowd: reliable deep reinforcement learning through ensembles of Q-functions	Sep 27, 2018	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Improvements on Hindsight Learning	Sep 16, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Image Captioning based on Deep Reinforcement Learning	Sep 13, 2018	Deep Reinforcement LearningImage Captioning	—Unverified	0
Learning to Interrupt: A Hierarchical Deep Reinforcement Learning Framework for Efficient Exploration	Jul 30, 2018	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Remember and Forget for Experience Replay	Jul 16, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Variance Reduction for Reinforcement Learning in Input-Driven Environments	Jul 6, 2018	Meta-LearningMuJoCo	—Unverified	0
Learning Goal-Oriented Visual Dialog via Tempered Policy Gradient	Jul 2, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Policy Optimization with Demonstrations	Jul 1, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 13 of 16Next →

No leaderboard results yet.