Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11201–11250 of 15113 papers

Title	Date	Tasks	Status	Hype
End-to-End Vision-Based Adaptive Cruise Control (ACC) Using Deep Reinforcement Learning	Jan 24, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
PCGRL: Procedural Content Generation via Reinforcement Learning	Jan 24, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Multi-objective Neural Architecture Search via Non-stationary Policy Gradient	Jan 23, 2020	Neural Architecture SearchReinforcement Learning	—Unverified	0
Facial Feedback for Reinforcement Learning: A Case Study and Offline Analysis Using the TAMER Framework	Jan 23, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Interpretable End-to-end Urban Autonomous Driving with Latent Deep Reinforcement Learning	Jan 23, 2020	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	1
Graph Constrained Reinforcement Learning for Natural Language Action Spaces	Jan 23, 2020	Action GenerationNatural Language Understanding	CodeCode Available	1
Reducing Non-Normative Text Generation from Language Models	Jan 23, 2020	Language Modellingreinforcement-learning	—Unverified	0
GLIB: Efficient Exploration for Relational Model-Based Reinforcement Learning via Goal-Literal Babbling	Jan 22, 2020	Decision MakingEfficient Exploration	CodeCode Available	0
Reinforcement Learning Based Vehicle-cell Association Algorithm for Highly Mobile Millimeter Wave Communication	Jan 22, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
On Simple Reactive Neural Networks for Behaviour-Based Reinforcement Learning	Jan 22, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
On Solving Cooperative MARL Problems with a Few Good Experiences	Jan 22, 2020	DescriptiveMulti-agent Reinforcement Learning	—Unverified	0
Local Policy Optimization for Trajectory-Centric Reinforcement Learning	Jan 22, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Emergence of Pragmatics from Referential Game between Theory of Mind Agents	Jan 21, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Cooperative Highway Work Zone Merge Control based on Reinforcement Learning in A Connected and Automated Environment	Jan 21, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Improving Interaction Quality Estimation with BiLSTMs and the Impact on Dialogue Policy Learning	Jan 21, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Intelligent Bandwidth Allocation for Latency Management in NG-EPON using Reinforcement Learning Methods	Jan 21, 2020	Managementreinforcement-learning	—Unverified	0
Unsupervisedly Learned Representations: Should the Quest be Over?	Jan 21, 2020	General Classificationreinforcement-learning	—Unverified	0
Lyceum: An efficient and scalable ecosystem for robot learning	Jan 21, 2020	Model Predictive ControlMuJoCo	—Unverified	0
SARL*: Deep Reinforcement Learning based Human-Aware Navigation for Mobile Robot in Indoor Environments	Jan 20, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning with Probabilistically Complete Exploration	Jan 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Nested-Wasserstein Self-Imitation Learning for Sequence Generation	Jan 20, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Memristor Hardware-Friendly Reinforcement Learning	Jan 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
FRESH: Interactive Reward Shaping in High-Dimensional State Spaces using Human Feedback	Jan 19, 2020	Atari GamesDeep Reinforcement Learning	—Unverified	0
A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions	Jan 19, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Discriminator Soft Actor Critic without Extrinsic Rewards	Jan 19, 2020	Imitation LearningQ-Learning	CodeCode Available	1
Gradient Surgery for Multi-Task Learning	Jan 19, 2020	Deep Reinforcement Learningimage-classification	CodeCode Available	1
Learning Options from Demonstration using Skill Segmentation	Jan 19, 2020	Clusteringreinforcement-learning	—Unverified	0
cube2net: Efficient Query-Specific Network Construction with Data Cube Organization	Jan 18, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
BNAS:An Efficient Neural Architecture Search Approach Using Broad Scalable Architecture	Jan 18, 2020	Neural Architecture Searchreinforcement-learning	—Unverified	0
Multi-agent Motion Planning for Dense and Dynamic Environments via Deep Reinforcement Learning	Jan 18, 2020	Deep Reinforcement LearningMotion Planning	—Unverified	0
Tree-Structured Policy based Progressive Reinforcement Learning for Temporally Language Grounding in Video	Jan 18, 2020	Decision Makingreinforcement-learning	CodeCode Available	1
Algorithms in Multi-Agent Systems: A Holistic Perspective from Reinforcement Learning and Game Theory	Jan 17, 2020	counterfactualDeep Reinforcement Learning	—Unverified	0
Reward Shaping for Reinforcement Learning with Omega-Regular Objectives	Jan 16, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
MIME: Mutual Information Minimisation Exploration	Jan 16, 2020	Montezuma's Revengereinforcement-learning	—Unverified	0
Model-based Multi-Agent Reinforcement Learning with Cooperative Prioritized Sweeping	Jan 15, 2020	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
SEERL: Sample Efficient Ensemble Reinforcement Learning	Jan 15, 2020	continuous-controlContinuous Control	—Unverified	0
Robotic Grasp Manipulation Using Evolutionary Computing and Deep Reinforcement Learning	Jan 15, 2020	Deep Reinforcement LearningPose Estimation	—Unverified	0
Lipschitz Lifelong Reinforcement Learning	Jan 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Continuous-action Reinforcement Learning for Playing Racing Games: Comparing SPG to PPO	Jan 15, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	0
PoPS: Policy Pruning and Shrinking for Deep Reinforcement Learning	Jan 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-Robot Formation Control Using Reinforcement Learning	Jan 13, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Statistical Inference of the Value Function for Reinforcement Learning in Infinite Horizon Settings	Jan 13, 2020	Decision Makingreinforcement-learning	CodeCode Available	0
POPCORN: Partially Observed Prediction COnstrained ReiNforcement Learning	Jan 13, 2020	Decision MakingPrediction	CodeCode Available	1
GridMask Data Augmentation	Jan 13, 2020	Data Augmentationobject-detection	CodeCode Available	1
Exploiting Language Instructions for Interpretable and Compositional Reinforcement Learning	Jan 13, 2020	ClassificationDiagnostic	—Unverified	0
Learning to Locomote with Deep Neural-Network and CPG-based Control in a Soft Snake Robot	Jan 13, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Weakly Supervised Video Summarization by Hierarchical Reinforcement Learning	Jan 12, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Complex Manipulation Tasks with Sparse Feedback	Jan 12, 2020	Deep Reinforcement LearningMulti-Goal Reinforcement Learning	—Unverified	0
Sparse Black-box Video Attack with Reinforcement Learning	Jan 11, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reward Engineering for Object Pick and Place Training	Jan 11, 2020	Objectreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 225 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified