Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1951–2000 of 15113 papers

Title	Date	Tasks	Status	Hype
Unified Models of Human Behavioral Agents in Bandits, Contextual Bandits and RL	May 10, 2020	Decision MakingLifelong learning	CodeCode Available	1
ALLSTEPS: Curriculum-driven Learning of Stepping Stone Skills	May 9, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Learning hierarchical behavior and motion planning for autonomous driving	May 8, 2020	Autonomous DrivingDecision Making	CodeCode Available	1
SUPERT: Towards New Frontiers in Unsupervised Evaluation Metrics for Multi-Document Summarization	May 7, 2020	Document SummarizationMulti-Document Summarization	CodeCode Available	1
Curious Hierarchical Actor-Critic Reinforcement Learning	May 7, 2020	BenchmarkingHierarchical Reinforcement Learning	CodeCode Available	1
CARL: Controllable Agent with Reinforcement Learning for Quadruped Locomotion	May 7, 2020	Deep Reinforcement LearningMotion Synthesis	CodeCode Available	1
Plan2Vec: Unsupervised Representation Learning by Latent Plans	May 7, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems	May 4, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Off-Policy Adversarial Inverse Reinforcement Learning	May 3, 2020	continuous-controlContinuous Control	CodeCode Available	1
Learning Collaborative Agents with Rule Guidance for Knowledge Graph Reasoning	May 1, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
RaCT: Toward Amortized Ranking-Critical Training For Collaborative Filtering	May 1, 2020	Collaborative FilteringLearning-To-Rank	CodeCode Available	1
Option Discovery using Deep Skill Chaining	May 1, 2020	continuous-controlContinuous Control	CodeCode Available	1
Logic and the 2-Simplicial Transformer	May 1, 2020	Deep Reinforcement LearningInductive Bias	CodeCode Available	1
Implementation Matters in Deep RL: A Case Study on PPO and TRPO	May 1, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Symbolic Superoptimization Without Human Knowledge	May 1, 2020	Decoderreinforcement-learning	CodeCode Available	1
Reinforcement Learning with Augmented Data	Apr 30, 2020	Data AugmentationOpenAI Gym	CodeCode Available	1
Actor-Critic Reinforcement Learning for Control with Stability Guarantee	Apr 29, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
Hierarchical Reinforcement Learning for Automatic Disease Diagnosis	Apr 29, 2020	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1
Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels	Apr 28, 2020	AllAtari Games 100k	CodeCode Available	1
Transferable Active Grasping and Real Embodied Dataset	Apr 28, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Emergent Real-World Robotic Skills via Unsupervised Off-Policy Reinforcement Learning	Apr 27, 2020	Model Predictive Controlreinforcement-learning	CodeCode Available	1
First return, then explore	Apr 27, 2020	Atari GamesMontezuma's Revenge	CodeCode Available	1
Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning	Apr 26, 2020	Drug DesignDrug Discovery	CodeCode Available	1
CFR-RL: Traffic Engineering with Reinforcement Learning in SDN	Apr 24, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Curiosity-Driven Energy-Efficient Worker Scheduling in Vehicular Crowdsourcing: A Deep Reinforcement Learning Approach	Apr 24, 2020	Deep Reinforcement LearningFairness	CodeCode Available	1
Self-Paced Deep Reinforcement Learning	Apr 24, 2020	Deep Reinforcement LearningOpen-Ended Question Answering	CodeCode Available	1
Model-Based Meta-Reinforcement Learning for Flight with Suspended Payloads	Apr 23, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available	1
Tactical Decision-Making in Autonomous Driving by Reinforcement Learning with Uncertainty Estimation	Apr 22, 2020	Autonomous DrivingDecision Making	CodeCode Available	1
Chip Placement with Deep Reinforcement Learning	Apr 22, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Energy-Based Imitation Learning	Apr 20, 2020	Imitation Learningreinforcement-learning	CodeCode Available	1
Continual Reinforcement Learning with Multi-Timescale Replay	Apr 16, 2020	Continual Learningcontinuous-control	CodeCode Available	1
Fast Template Matching and Update for Video Object Tracking and Segmentation	Apr 16, 2020	Object Trackingreinforcement-learning	CodeCode Available	1
MARLeME: A Multi-Agent Reinforcement Learning Model Extraction Library	Apr 16, 2020	Model extractionMulti-agent Reinforcement Learning	CodeCode Available	1
Zero-Shot Compositional Policy Learning via Language Grounding	Apr 15, 2020	DescriptiveDomain Adaptation	CodeCode Available	1
Prolog Technology Reinforcement Learning Prover	Apr 15, 2020	Automated Theorem Provingreinforcement-learning	CodeCode Available	1
A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation	Apr 14, 2020	Deep Reinforcement LearningInteractive Recommendation	CodeCode Available	1
PatchAttack: A Black-box Texture-based Attack with Reinforcement Learning	Apr 12, 2020	Adversarial DefenseClustering	CodeCode Available	1
Topological Quantum Compiling with Reinforcement Learning	Apr 9, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Adaptive Transformers in RL	Apr 8, 2020	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available	1
Continual Learning with Gated Incremental Memories for sequential data processing	Apr 8, 2020	Continual LearningReinforcement Learning	CodeCode Available	1
Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward Decomposition	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
CURL: Contrastive Unsupervised Representations for Reinforcement Learning	Apr 8, 2020	Atari GamesAtari Games 100k	CodeCode Available	1
An Application of Deep Reinforcement Learning to Algorithmic Trading	Apr 7, 2020	Algorithmic TradingDeep Reinforcement Learning	CodeCode Available	1
MRI Reconstruction with Interpretable Pixel-Wise Operations Using Reinforcement Learning	Apr 3, 2020	compressed sensingDeep Reinforcement Learning	CodeCode Available	1
Learning 2-opt Heuristics for the Traveling Salesman Problem via Deep Reinforcement Learning	Apr 3, 2020	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
Action Space Shaping in Deep Reinforcement Learning	Apr 2, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-Task Reinforcement Learning with Soft Modularization	Mar 30, 2020	Meta-LearningMulti-Task Learning	CodeCode Available	1
Agent57: Outperforming the Atari Human Benchmark	Mar 30, 2020	Atari GamesReinforcement Learning	CodeCode Available	1
Deep reinforcement learning for large-scale epidemic control	Mar 30, 2020	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1
Ultrasound-Guided Robotic Navigation with Deep Reinforcement Learning	Mar 30, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 40 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified