Policy Gradient Methods

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 382 papers

Title	Date	Tasks	Status
Similarities between policy gradient methods (PGM) in Reinforcement learning (RL) and supervised learning (SL)	Apr 12, 2019	Decision MakingPolicy Gradient Methods	—Unverified
Only Relevant Information Matters: Filtering Out Noisy Samples to Boost RL	Apr 8, 2019	continuous-controlContinuous Control	—Unverified
StartNet: Online Detection of Action Start in Untrimmed Videos	Mar 23, 2019	Action ClassificationPolicy Gradient Methods	—Unverified
Evaluating Rewards for Question Generation Models	Feb 28, 2019	Machine TranslationPolicy Gradient Methods	CodeCode Available
Rethinking Action Spaces for Reinforcement Learning in End-to-end Dialog Agents with Latent Variable Models	Feb 23, 2019	Decision MakingDialogue Generation	CodeCode Available
Fast Efficient Hyperparameter Tuning for Policy Gradients	Feb 18, 2019	Meta-LearningPolicy Gradient Methods	CodeCode Available
Diverse Exploration via Conjugate Policies for Policy Gradient Methods	Feb 10, 2019	Policy Gradient Methods	—Unverified
On-Policy Trust Region Policy Optimisation with Replay Buffers	Jan 18, 2019	Continuous ControlDeep Reinforcement Learning	CodeCode Available
Communication-Efficient Policy Gradient Methods for Distributed Reinforcement Learning	Dec 7, 2018	Distributed ComputingMulti-agent Reinforcement Learning	—Unverified
AdaFrame: Adaptive Frame Selection for Fast Video Recognition	Nov 29, 2018	Policy Gradient MethodsVideo Recognition	—Unverified
An Off-policy Policy Gradient Theorem Using Emphatic Weightings	Nov 22, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
Reward-estimation variance elimination in sequential decision processes	Nov 15, 2018	Policy Gradient MethodsReinforcement Learning	—Unverified
Risk-Sensitive Reinforcement Learning via Policy Gradient Search	Oct 22, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Greedy Actor-Critic: A New Conditional Cross-Entropy Method for Policy Improvement	Oct 22, 2018	Policy Gradient MethodsQ-Learning	CodeCode Available
Policy Gradient in Partially Observable Environments: Approximation and Convergence	Oct 18, 2018	Decision MakingPolicy Gradient Methods	—Unverified
Where Did My Optimum Go?: An Empirical Analysis of Gradient Descent Optimization in Policy Gradient Methods	Oct 5, 2018	continuous-controlContinuous Control	CodeCode Available
Training for Diversity in Image Paragraph Captioning	Oct 1, 2018	DiversityImage Captioning	CodeCode Available
CaLcs: Continuously Approximating Longest Common Subsequence for Sequence Level Optimization	Oct 1, 2018	Abstractive Text SummarizationImage Captioning	—Unverified
Countering Language Drift via Grounding	Sep 27, 2018	Language ModelingLanguage Modelling	—Unverified
Assumption Questioning: Latent Copying and Reward Exploitation in Question Generation	Sep 27, 2018	Inductive BiasMachine Translation	—Unverified
The wisdom of the crowd: reliable deep reinforcement learning through ensembles of Q-functions	Sep 27, 2018	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Improvements on Hindsight Learning	Sep 16, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Image Captioning based on Deep Reinforcement Learning	Sep 13, 2018	Deep Reinforcement LearningImage Captioning	—Unverified
Learning to Interrupt: A Hierarchical Deep Reinforcement Learning Framework for Efficient Exploration	Jul 30, 2018	Deep Reinforcement LearningEfficient Exploration	—Unverified
Remember and Forget for Experience Replay	Jul 16, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available

Show:10 25 50

← PrevPage 13 of 16Next →

No leaderboard results yet.