Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11601–11650 of 15113 papers

Title	Date	Tasks	Status	Hype
Gym-Ignition: Reproducible Robotic Simulations for Reinforcement Learning	Nov 5, 2019	OpenAI Gymreinforcement-learning	CodeCode Available	0
DeepRacer: Educational Autonomous Racing Platform for Experimentation with Sim2Real Reinforcement Learning	Nov 5, 2019	Autonomous RacingDeep Reinforcement Learning	—Unverified	0
Fully Parameterized Quantile Function for Distributional Reinforcement Learning	Nov 5, 2019	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
A Deep Reinforcement Learning Approach to First-Order Logic Theorem Proving	Nov 5, 2019	Automated Theorem ProvingDeep Reinforcement Learning	CodeCode Available	1
Quinoa: a Q-function You Infer Normalized Over Actions	Nov 5, 2019	Normalising Flowsreinforcement-learning	—Unverified	0
Robo-advising: Learning Investors' Risk Preferences via Portfolio Choices	Nov 5, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Robotic Tracking Control with Kernel Trick-based Reinforcement Learning	Nov 4, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
An End-to-End Deep RL Framework for Task Arrangement in Crowdsourcing Platforms	Nov 4, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Learning from Trajectories via Subgoal Discovery	Nov 3, 2019	Imitation LearningReinforcement Learning	CodeCode Available	0
Non-Cooperative Inverse Reinforcement Learning	Nov 3, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Online Robustness Training for Deep Reinforcement Learning	Nov 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Problem Dependent Reinforcement Learning Bounds Which Can Identify Bandit Structure in MDPs	Nov 3, 2019	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Maximum Entropy Diverse Exploration: Disentangling Maximum Entropy Reinforcement Learning	Nov 3, 2019	Diversityreinforcement-learning	—Unverified	0
On Solving the 2-Dimensional Greedy Shooter Problem for UAVs	Nov 2, 2019	Q-Learningreinforcement-learning	CodeCode Available	0
Thompson Sampling for Contextual Bandit Problems with Auxiliary Safety Constraints	Nov 2, 2019	Bayesian OptimizationDecision Making	—Unverified	0
Explicit Explore-Exploit Algorithms in Continuous State Spaces	Nov 1, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Frequentist Regret Bounds for Randomized Least-Squares Value Iteration	Nov 1, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Generating Formality-Tuned Summaries Using Input-Dependent Rewards	Nov 1, 2019	Abstractive Text Summarizationreinforcement-learning	—Unverified	0
DIVINE: A Generative Adversarial Imitation Learning Framework for Knowledge Graph Reasoning	Nov 1, 2019	Imitation LearningKnowledge Graphs	—Unverified	0
Deep Reinforcement Learning-based Text Anonymization against Private-Attribute Inference	Nov 1, 2019	AttributeDeep Reinforcement Learning	—Unverified	0
Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcement Learning	Nov 1, 2019	Deep Reinforcement LearningGraph Attention	—Unverified	0
Generalized Speedy Q-learning	Nov 1, 2019	Q-LearningReinforcement Learning	CodeCode Available	0
Learning the Extraction Order of Multiple Relational Facts in a Sentence with Reinforcement Learning	Nov 1, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A2: Extracting Cyclic Switchings from DOB-nets for Rejecting Excessive Disturbances	Nov 1, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Exploring Diverse Expressions for Paraphrase Generation	Nov 1, 2019	DiversityInformation Retrieval	—Unverified	0
Situated GAIL: Multitask imitation using task-conditioned adversarial inverse reinforcement learning	Nov 1, 2019	Imitation Learningreinforcement-learning	—Unverified	0
Positive-Unlabeled Reward Learning	Nov 1, 2019	Imitation LearningReinforcement Learning	—Unverified	0
Neural Topic Model with Reinforcement Learning	Nov 1, 2019	modelreinforcement-learning	—Unverified	0
Answer-Supervised Question Reformulation for Enhancing Conversational Machine Comprehension	Nov 1, 2019	Reading Comprehensionreinforcement-learning	—Unverified	0
DeepLine: AutoML Tool for Pipelines Generation using Deep Reinforcement Learning and Hierarchical Actions Filtering	Oct 31, 2019	AutoMLBIG-bench Machine Learning	—Unverified	0
Hierarchical Expert Networks for Meta-Learning	Oct 31, 2019	image-classificationImage Classification	—Unverified	0
PIC: Permutation Invariant Critic for Multi-Agent Deep Reinforcement Learning	Oct 31, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
VASE: Variational Assorted Surprise Exploration for Reinforcement Learning	Oct 31, 2019	continuous-controlContinuous Control	—Unverified	0
RLINK: Deep Reinforcement Learning for User Identity Linkage	Oct 31, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Cascaded LSTMs based Deep Reinforcement Learning for Goal-driven Dialogue	Oct 31, 2019	Deep Reinforcement LearningDialogue Management	CodeCode Available	0
Learning Algorithmic Solutions to Symbolic Planning Tasks with a Neural Computer Architecture	Oct 30, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
DADI: Dynamic Discovery of Fair Information with Adversarial Reinforcement Learning	Oct 30, 2019	Fairnessreinforcement-learning	—Unverified	0
A Distributed Model-Free Algorithm for Multi-hop Ride-sharing using Deep Reinforcement Learning	Oct 30, 2019	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
RBED: Reward Based Epsilon Decay	Oct 30, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Policy Continuation with Hindsight Inverse Dynamics	Oct 30, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation	Oct 30, 2019	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1
Deep reinforcement learning for market making in corporate bonds: beating the curse of dimensionality	Oct 29, 2019	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning for Distributed Uncoordinated Cognitive Radios Resource Allocation	Oct 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive Sampling Quasi-Newton Methods for Derivative-Free Stochastic Optimization	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Feedback Linearization for Unknown Systems via Reinforcement Learning	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Manipulate Deformable Objects without Demonstrations	Oct 29, 2019	Deformable Object ManipulationObject	CodeCode Available	1
Navigation Agents for the Visually Impaired: A Sidewalk Simulator and Experiments	Oct 29, 2019	NavigateReinforcement Learning	CodeCode Available	0
Deep Decentralized Reinforcement Learning for Cooperative Control	Oct 29, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Overcoming Catastrophic Interference in Online Reinforcement Learning with Dynamic Self-Organizing Maps	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Robust Model-free Reinforcement Learning with Multi-objective Bayesian Optimization	Oct 29, 2019	Bayesian Optimizationreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 233 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified