Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11801–11850 of 15113 papers

Title	Date	Tasks	Status	Hype
Improving Sample Efficiency in Model-Free Reinforcement Learning from Images	Oct 2, 2019	Image ReconstructionMuJoCo	CodeCode Available	1
AI Assisted Annotator using Reinforcement Learning	Oct 2, 2019	Decision Makingreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Single-Shot Diagnosis and Adaptation in Damaged Robots	Oct 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
CWAE-IRL: Formulating a supervised approach to Inverse Reinforcement Learning problem	Oct 2, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Generating Paraphrases with Lean Vocabulary	Oct 1, 2019	Paraphrase Generationreinforcement-learning	—Unverified	0
Fair Loss: Margin-Aware Reinforcement Learning for Deep Face Recognition	Oct 1, 2019	Face RecognitionQ-Learning	—Unverified	0
SME-Net: Sparse Motion Estimation for Parametric Video Prediction Through Reinforcement Learning	Oct 1, 2019	Motion CompensationMotion Estimation	CodeCode Available	0
Deep Reinforcement Active Learning for Human-in-the-Loop Person Re-Identification	Oct 1, 2019	Active LearningDeep Reinforcement Learning	—Unverified	0
Quantile QT-Opt for Risk-Aware Vision-Based Robotic Grasping	Oct 1, 2019	Q-LearningReinforcement Learning	—Unverified	0
Reinforcement Learning for Multi-Objective Optimization of Online Decisions in High-Dimensional Systems	Oct 1, 2019	Decision MakingManagement	—Unverified	0
Machine Translation for Machines: the Sentiment Classification Use Case	Oct 1, 2019	ClassificationGeneral Classification	—Unverified	0
Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning	Oct 1, 2019	continuous-controlContinuous Control	CodeCode Available	1
Generalization in Generation: A closer look at Exposure Bias	Oct 1, 2019	Language ModelingLanguage Modelling	—Unverified	0
Dynamic Interaction-Aware Scene Understanding for Reinforcement Learning in Autonomous Driving	Sep 30, 2019	Autonomous DrivingDecision Making	—Unverified	0
End-to-End Motion Planning of Quadrotors Using Deep Reinforcement Learning	Sep 30, 2019	Deep Reinforcement LearningMotion Planning	—Unverified	0
MGHRL: Meta Goal-generation for Hierarchical Reinforcement Learning	Sep 30, 2019	Hierarchical Reinforcement LearningMeta-Learning	—Unverified	0
RLCache: Automated Cache Management Using Reinforcement Learning	Sep 30, 2019	Managementreinforcement-learning	—Unverified	0
Multiagent Rollout Algorithms and Reinforcement Learning	Sep 30, 2019	Computational Efficiencyreinforcement-learning	CodeCode Available	0
Tensor-based Cooperative Control for Large Scale Multi-intersection Traffic Signal Using Deep Reinforcement Learning and Imitation Learning	Sep 30, 2019	Deep Reinforcement LearningImitation Learning	—Unverified	0
Relational Graph Learning for Crowd Navigation	Sep 28, 2019	Deep Reinforcement LearningGraph Learning	CodeCode Available	0
MULTIPOLAR: Multi-Source Policy Aggregation for Transfer Reinforcement Learning between Diverse Environmental Dynamics	Sep 28, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Accelerating the Computation of UCB and Related Indices for Reinforcement Learning	Sep 28, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning Based Power control for Wireless Multicast Systems	Sep 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive ROI Generation for Video Object Segmentation Using Reinforcement Learning	Sep 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep Coordination Graphs	Sep 27, 2019	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	0
Interaction-Aware Multi-Agent Reinforcement Learning for Mobile Agents with Individual Goals	Sep 27, 2019	Autonomous DrivingMulti-agent Reinforcement Learning	—Unverified	0
Playing Atari Ball Games with Hierarchical Reinforcement Learning	Sep 27, 2019	Atari GamesHierarchical Reinforcement Learning	—Unverified	0
Safe Reinforcement Learning on Autonomous Vehicles	Sep 27, 2019	Autonomous Vehiclesreinforcement-learning	—Unverified	0
SURREAL-System: Fully-Integrated Stack for Distributed Deep Reinforcement Learning	Sep 27, 2019	CPUDeep Reinforcement Learning	—Unverified	0
LIMIS: Locally Interpretable Modeling using Instance-wise Subsampling	Sep 26, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
CAQL: Continuous Action Q-Learning	Sep 26, 2019	continuous-controlContinuous Control	—Unverified	0
MERL: Multi-Head Reinforcement Learning	Sep 26, 2019	continuous-controlContinuous Control	—Unverified	0
Can Q-Learning with Graph Networks Learn a Generalizable Branching Heuristic for a SAT Solver?	Sep 26, 2019	Feature EngineeringQ-Learning	CodeCode Available	1
Scaling data-driven robotics with reward sketching and batch reinforcement learning	Sep 26, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Visual Exploration and Energy-aware Path Planning via Reinforcement Learning	Sep 26, 2019	Autonomous Vehiclesobject-detection	CodeCode Available	0
Harnessing Structures for Value-Based Planning and Reinforcement Learning	Sep 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Relationship Explainable Multi-objective Reinforcement Learning with Semantic Explainability Generation	Sep 26, 2019	MuJoCoMulti-Objective Reinforcement Learning	—Unverified	0
Towards a Metric for Automated Conversational Dialogue System Evaluation and Improvement	Sep 26, 2019	Open-Ended Question AnsweringReinforcement Learning	—Unverified	0
Solving single-objective tasks by preference multi-objective reinforcement learning	Sep 25, 2019	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
QXplore: Q-Learning Exploration by Maximizing Temporal Difference Error	Sep 25, 2019	continuous-controlContinuous Control	—Unverified	0
Self-Supervised State-Control through Intrinsic Mutual Information Rewards	Sep 25, 2019	OpenAI Gymreinforcement-learning	CodeCode Available	0
Modeling Fake News in Social Networks with Deep Multi-Agent Reinforcement Learning	Sep 25, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Multi-Agent Hierarchical Reinforcement Learning for Humanoid Navigation	Sep 25, 2019	Collision AvoidanceHierarchical Reinforcement Learning	—Unverified	0
Multiagent Reinforcement Learning in Games with an Iterated Dominance Solution	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Partial Simulation for Imitation Learning	Sep 25, 2019	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Long-term planning, short-term adjustments	Sep 25, 2019	Deep Reinforcement LearningPrediction	—Unverified	0
Risk Averse Value Expansion for Sample Efficient and Robust Policy Learning	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified	0
Meta Learning via Learned Loss	Sep 25, 2019	Meta-Learningreinforcement-learning	—Unverified	0
Stabilizing Off-Policy Reinforcement Learning with Conservative Policy Gradients	Sep 25, 2019	Deep Reinforcement LearningMuJoCo	—Unverified	0
Policy Optimization by Local Improvement through Search	Sep 25, 2019	Imitation Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 237 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified