Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11951–12000 of 15113 papers

Title	Date	Tasks	Status
Multi-step Greedy Reinforcement Learning Algorithms	Oct 7, 2019	Continuous ControlGame of Go	—Unverified
Multi-Agent Reinforcement Learning for Order-dispatching via Order-Vehicle Distribution Matching	Oct 7, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Is a Good Representation Sufficient for Sample Efficient Reinforcement Learning?	Oct 7, 2019	Imitation Learningreinforcement-learning	—Unverified
Biased Aggregation, Rollout, and Enhanced Policy Improvement for Reinforcement Learning	Oct 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Probabilistic Successor Representations with Kalman Temporal Differences	Oct 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Attention-based Fault-tolerant Approach for Multi-agent Reinforcement Learning Systems	Oct 5, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Discounted Reinforcement Learning Is Not an Optimization Problem	Oct 4, 2019	Misconceptionsreinforcement-learning	—Unverified
DeepMNavigate: Deep Reinforced Multi-Robot Navigation Unifying Local & Global Collision Avoidance	Oct 4, 2019	Collision AvoidanceDeep Reinforcement Learning	—Unverified
I'm sorry Dave, I'm afraid I can't do that, Deep Q-learning from forbidden action	Oct 4, 2019	Industrial RobotsQ-Learning	—Unverified
Manufacturing Dispatching using Reinforcement and Transfer Learning	Oct 4, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Zero Shot Learning on Simulated Robots	Oct 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
Using Logical Specifications of Objectives in Multi-Objective Reinforcement Learning	Oct 3, 2019	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
SensorDrop: A Reinforcement Learning Framework for Communication Overhead Reduction on the Edge	Oct 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reducing Overestimation Bias in Multi-Agent Domains Using Double Centralized Critics	Oct 3, 2019	Multi-agent Reinforcement LearningReinforcement Learning	CodeCode Available
Machine learning strategies for path-planning microswimmers in turbulent flows	Oct 3, 2019	BIG-bench Machine LearningPosition	—Unverified
Hybrid Zero Dynamics Inspired Feedback Control Policy Design for 3D Bipedal Locomotion using Reinforcement Learning	Oct 3, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Review of Learning-based Longitudinal Motion Planning for Autonomous Vehicles: Research Gaps between Self-driving and Traffic Congestion	Oct 2, 2019	Autonomous VehiclesBIG-bench Machine Learning	—Unverified
AI Assisted Annotator using Reinforcement Learning	Oct 2, 2019	Decision Makingreinforcement-learning	—Unverified
CWAE-IRL: Formulating a supervised approach to Inverse Reinforcement Learning problem	Oct 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Single-Shot Diagnosis and Adaptation in Damaged Robots	Oct 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Never Worse, Mostly Better: Stable Policy Improvement in Deep Reinforcement Learning	Oct 2, 2019	continuous-controlContinuous Control	—Unverified
QuaRL: Quantization for Fast and Environmentally Sustainable Reinforcement Learning	Oct 2, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Relationship Explainable Multi-objective Optimization Via Vector Value Function Based Reinforcement Learning	Oct 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Language is Power: Representing States Using Natural Language in Reinforcement Learning	Oct 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
SME-Net: Sparse Motion Estimation for Parametric Video Prediction Through Reinforcement Learning	Oct 1, 2019	Motion CompensationMotion Estimation	CodeCode Available
Reinforcement Learning for Multi-Objective Optimization of Online Decisions in High-Dimensional Systems	Oct 1, 2019	Decision MakingManagement	—Unverified
Machine Translation for Machines: the Sentiment Classification Use Case	Oct 1, 2019	ClassificationGeneral Classification	—Unverified
Quantile QT-Opt for Risk-Aware Vision-Based Robotic Grasping	Oct 1, 2019	Q-LearningReinforcement Learning	—Unverified
Fair Loss: Margin-Aware Reinforcement Learning for Deep Face Recognition	Oct 1, 2019	Face RecognitionQ-Learning	—Unverified
Deep Reinforcement Active Learning for Human-in-the-Loop Person Re-Identification	Oct 1, 2019	Active LearningDeep Reinforcement Learning	—Unverified
Generalization in Generation: A closer look at Exposure Bias	Oct 1, 2019	Language ModelingLanguage Modelling	—Unverified
Generating Paraphrases with Lean Vocabulary	Oct 1, 2019	Paraphrase Generationreinforcement-learning	—Unverified
MGHRL: Meta Goal-generation for Hierarchical Reinforcement Learning	Sep 30, 2019	Hierarchical Reinforcement LearningMeta-Learning	—Unverified
Dynamic Interaction-Aware Scene Understanding for Reinforcement Learning in Autonomous Driving	Sep 30, 2019	Autonomous DrivingDecision Making	—Unverified
End-to-End Motion Planning of Quadrotors Using Deep Reinforcement Learning	Sep 30, 2019	Deep Reinforcement LearningMotion Planning	—Unverified
RLCache: Automated Cache Management Using Reinforcement Learning	Sep 30, 2019	Managementreinforcement-learning	—Unverified
Tensor-based Cooperative Control for Large Scale Multi-intersection Traffic Signal Using Deep Reinforcement Learning and Imitation Learning	Sep 30, 2019	Deep Reinforcement LearningImitation Learning	—Unverified
Multiagent Rollout Algorithms and Reinforcement Learning	Sep 30, 2019	Computational Efficiencyreinforcement-learning	CodeCode Available
MULTIPOLAR: Multi-Source Policy Aggregation for Transfer Reinforcement Learning between Diverse Environmental Dynamics	Sep 28, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Relational Graph Learning for Crowd Navigation	Sep 28, 2019	Deep Reinforcement LearningGraph Learning	CodeCode Available
Accelerating the Computation of UCB and Related Indices for Reinforcement Learning	Sep 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Coordination Graphs	Sep 27, 2019	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Interaction-Aware Multi-Agent Reinforcement Learning for Mobile Agents with Individual Goals	Sep 27, 2019	Autonomous DrivingMulti-agent Reinforcement Learning	—Unverified
Deep Reinforcement Learning Based Power control for Wireless Multicast Systems	Sep 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive ROI Generation for Video Object Segmentation Using Reinforcement Learning	Sep 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Playing Atari Ball Games with Hierarchical Reinforcement Learning	Sep 27, 2019	Atari GamesHierarchical Reinforcement Learning	—Unverified
Safe Reinforcement Learning on Autonomous Vehicles	Sep 27, 2019	Autonomous Vehiclesreinforcement-learning	—Unverified
SURREAL-System: Fully-Integrated Stack for Distributed Deep Reinforcement Learning	Sep 27, 2019	CPUDeep Reinforcement Learning	—Unverified
Relationship Explainable Multi-objective Reinforcement Learning with Semantic Explainability Generation	Sep 26, 2019	MuJoCoMulti-Objective Reinforcement Learning	—Unverified
Towards a Metric for Automated Conversational Dialogue System Evaluation and Improvement	Sep 26, 2019	Open-Ended Question AnsweringReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 240 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified