Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10650 of 15113 papers

Title	Date	Tasks	Status	Hype
Decentralized Deep Reinforcement Learning for a Distributed and Adaptive Locomotion Controller of a Hexapod Robot	May 21, 2020	continuous-controlContinuous Control	CodeCode Available	1
Learning and Reasoning for Robot Dialog and Navigation Tasks	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Finite-sample Analysis of Greedy-GQ with Linear Function Approximation under Markovian Noise	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for High Level Character Control	May 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A reinforcement learning based decision support system in textile manufacturing process	May 20, 2020	Decision MakingQ-Learning	—Unverified	0
Reinforcement Learning for Variable Selection in a Branch and Bound Algorithm	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Mirror Descent Policy Optimization	May 20, 2020	continuous-controlContinuous Control	CodeCode Available	1
Two-stage Deep Reinforcement Learning for Inverter-based Volt-VAR Control in Active Distribution Networks	May 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Survey of Reinforcement Learning Algorithms for Dynamically Varying Environments	May 19, 2020	Cloud ComputingManagement	—Unverified	0
Learning to Herd Agents Amongst Obstacles: Training Robust Shepherding Behaviors using Deep Reinforcement Learning	May 19, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic Signal Optimization	May 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Experience Augmentation: Boosting and Accelerating Off-Policy Multi-Agent Reinforcement Learning	May 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Human Instruction-Following with Deep Reinforcement Learning via Transfer-Learning from Text	May 19, 2020	Deep Reinforcement LearningInstruction Following	—Unverified	0
Reinforcement Learning for Caching with Space-Time Popularity Dynamics	May 19, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Ultrasound Video Summarization using Deep Reinforcement Learning	May 19, 2020	Deep Reinforcement LearningDiagnostic	CodeCode Available	1
Privileged Information Dropout in Reinforcement Learning	May 19, 2020	Formreinforcement-learning	—Unverified	0
Optimal Charging Method for Effective Li-ion Battery Life Extension Based on Reinforcement Learning	May 18, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Local and Global Explanations of Agent Behavior: Integrating Strategy Summaries with Saliency Maps	May 18, 2020	Atari GamesDecision Making	CodeCode Available	0
Basal Glucose Control in Type 1 Diabetes using Deep Reinforcement Learning: An In Silico Validation	May 18, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
Automating Turbulence Modeling by Multi-Agent Reinforcement Learning	May 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
A Simple Imitation Learning Method via Contrastive Regularization	May 16, 2020	Atari GamesImitation Learning	—Unverified	0
Lifelong Control of Off-grid Microgrid with Model Based Reinforcement Learning	May 16, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning Transferable Concepts in Deep Reinforcement Learning	May 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Distributional View on Multi-Objective Policy Optimization	May 15, 2020	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Think Too Fast Nor Too Slow: The Computational Trade-off Between Planning And Reinforcement Learning	May 15, 2020	Decision MakingReinforcement Learning (RL)	CodeCode Available	0
Data-driven Dynamic Multi-objective Optimal Control: An Aspiration-satisfying Reinforcement Learning Approach	May 14, 2020	Decision MakingReinforcement Learning (RL)	—Unverified	0
Context-aware Dynamics Model for Generalization in Model-Based Reinforcement Learning	May 14, 2020	modelModel-based Reinforcement Learning	CodeCode Available	1
Solve Traveling Salesman Problem by Monte Carlo Tree Search and Deep Neural Network	May 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Stealthy and Efficient Adversarial Attacks against Deep Reinforcement Learning	May 14, 2020	Adversarial AttackDeep Reinforcement Learning	—Unverified	0
Probabilistic Guarantees for Safe Deep Reinforcement Learning	May 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Proxy Experience Replay: Federated Distillation for Distributed Reinforcement Learning	May 13, 2020	ClusteringData Augmentation	—Unverified	0
DREAM Architecture: a Developmental Approach to Open-Ended Learning in Robotics	May 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Explainable Reinforcement Learning: A Survey	May 13, 2020	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified	0
From Simulation to Real World Maneuver Execution using Deep Reinforcement Learning	May 13, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
A New Deep Neural Architecture Search Pipeline for Face Recognition	May 12, 2020	AutoMLFace Recognition	—Unverified	0
Unbiased Deep Reinforcement Learning: A General Training Framework for Existing and Future Algorithms	May 12, 2020	continuous-controlContinuous Control	—Unverified	0
MOReL : Model-Based Offline Reinforcement Learning	May 12, 2020	modelOffline RL	CodeCode Available	1
Training spiking neural networks using reinforcement learning	May 12, 2020	Decision Makingreinforcement-learning	CodeCode Available	1
Planning to Explore via Self-Supervised World Models	May 12, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Smooth Exploration for Robotic Reinforcement Learning	May 12, 2020	continuous-controlContinuous Control	CodeCode Available	2
Reinforcement Learning Based on Real-Time Iteration NMPC	May 11, 2020	Model Predictive Controlreinforcement-learning	—Unverified	0
Mobile Robot Path Planning in Dynamic Environments through Globally Guided Reinforcement Learning	May 11, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
TOMA: Topological Map Abstraction for Reinforcement Learning	May 11, 2020	Graph Generationreinforcement-learning	—Unverified	0
Delay-Aware Multi-Agent Reinforcement Learning for Cooperative and Competitive Environments	May 11, 2020	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	1
Delay-Aware Model-Based Reinforcement Learning for Continuous Control	May 11, 2020	continuous-controlContinuous Control	CodeCode Available	1
A Deep Reinforcement Learning Approach to Efficient Drone Mobility Support	May 11, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
Deep Reinforcement Learning for Organ Localization in CT	May 11, 2020	Deep Reinforcement LearningImage Retrieval	—Unverified	0
Maximizing Information Gain in Partially Observable Environments via Prediction Reward	May 11, 2020	PredictionQuestion Answering	—Unverified	0
Unified Models of Human Behavioral Agents in Bandits, Contextual Bandits and RL	May 10, 2020	Decision MakingLifelong learning	CodeCode Available	1
A Reinforcement Learning based approach for Multi-target Detection in Massive MIMO radar	May 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 213 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified