Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10951–11000 of 15113 papers

Title	Date	Tasks	Status
Adaptive Reinforcement Learning through Evolving Self-Modifying Neural Networks	May 22, 2020	Meta-Learningreinforcement-learning	—Unverified
Towards Automated Safety Coverage and Testing for Autonomous Vehicles with Reinforcement Learning	May 22, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
Reinforcement learning with human advice: a survey	May 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
Q-NAV: NAV Setting Method based on Reinforcement Learning in Underwater Wireless Networks	May 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning with General Value Function Approximation: Provably Efficient Approach via Bounded Eluder Dimension	May 21, 2020	Reinforcement Learning (RL)	—Unverified
Novel Policy Seeking with Constrained Optimization	May 21, 2020	DiversityMuJoCo	CodeCode Available
Two-stage Deep Reinforcement Learning for Inverter-based Volt-VAR Control in Active Distribution Networks	May 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Variable Selection in a Branch and Bound Algorithm	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning and Reasoning for Robot Dialog and Navigation Tasks	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for High Level Character Control	May 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Finite-sample Analysis of Greedy-GQ with Linear Function Approximation under Markovian Noise	May 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
A reinforcement learning based decision support system in textile manufacturing process	May 20, 2020	Decision MakingQ-Learning	—Unverified
Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic Signal Optimization	May 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Survey of Reinforcement Learning Algorithms for Dynamically Varying Environments	May 19, 2020	Cloud ComputingManagement	—Unverified
Human Instruction-Following with Deep Reinforcement Learning via Transfer-Learning from Text	May 19, 2020	Deep Reinforcement LearningInstruction Following	—Unverified
Experience Augmentation: Boosting and Accelerating Off-Policy Multi-Agent Reinforcement Learning	May 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Learning to Herd Agents Amongst Obstacles: Training Robust Shepherding Behaviors using Deep Reinforcement Learning	May 19, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Privileged Information Dropout in Reinforcement Learning	May 19, 2020	Formreinforcement-learning	—Unverified
Reinforcement Learning for Caching with Space-Time Popularity Dynamics	May 19, 2020	reinforcement-learningReinforcement Learning	—Unverified
Optimal Charging Method for Effective Li-ion Battery Life Extension Based on Reinforcement Learning	May 18, 2020	reinforcement-learningReinforcement Learning	—Unverified
Basal Glucose Control in Type 1 Diabetes using Deep Reinforcement Learning: An In Silico Validation	May 18, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Local and Global Explanations of Agent Behavior: Integrating Strategy Summaries with Saliency Maps	May 18, 2020	Atari GamesDecision Making	CodeCode Available
Automating Turbulence Modeling by Multi-Agent Reinforcement Learning	May 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Learning Transferable Concepts in Deep Reinforcement Learning	May 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Simple Imitation Learning Method via Contrastive Regularization	May 16, 2020	Atari GamesImitation Learning	—Unverified
A Distributional View on Multi-Objective Policy Optimization	May 15, 2020	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified
Think Too Fast Nor Too Slow: The Computational Trade-off Between Planning And Reinforcement Learning	May 15, 2020	Decision MakingReinforcement Learning (RL)	CodeCode Available
Solve Traveling Salesman Problem by Monte Carlo Tree Search and Deep Neural Network	May 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Stealthy and Efficient Adversarial Attacks against Deep Reinforcement Learning	May 14, 2020	Adversarial AttackDeep Reinforcement Learning	—Unverified
Probabilistic Guarantees for Safe Deep Reinforcement Learning	May 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data-driven Dynamic Multi-objective Optimal Control: An Aspiration-satisfying Reinforcement Learning Approach	May 14, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
DREAM Architecture: a Developmental Approach to Open-Ended Learning in Robotics	May 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
From Simulation to Real World Maneuver Execution using Deep Reinforcement Learning	May 13, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Explainable Reinforcement Learning: A Survey	May 13, 2020	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified
Proxy Experience Replay: Federated Distillation for Distributed Reinforcement Learning	May 13, 2020	ClusteringData Augmentation	—Unverified
Unbiased Deep Reinforcement Learning: A General Training Framework for Existing and Future Algorithms	May 12, 2020	continuous-controlContinuous Control	—Unverified
A New Deep Neural Architecture Search Pipeline for Face Recognition	May 12, 2020	AutoMLFace Recognition	—Unverified
Deep Reinforcement Learning for Organ Localization in CT	May 11, 2020	Deep Reinforcement LearningImage Retrieval	—Unverified
A Deep Reinforcement Learning Approach to Efficient Drone Mobility Support	May 11, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning Based on Real-Time Iteration NMPC	May 11, 2020	Model Predictive Controlreinforcement-learning	—Unverified
TOMA: Topological Map Abstraction for Reinforcement Learning	May 11, 2020	Graph Generationreinforcement-learning	—Unverified
Maximizing Information Gain in Partially Observable Environments via Prediction Reward	May 11, 2020	PredictionQuestion Answering	—Unverified
Optimal PID and Antiwindup Control Design as a Reinforcement Learning Problem	May 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning based Design of Linear Fixed Structure Controllers	May 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Reinforcement Learning based approach for Multi-target Detection in Massive MIMO radar	May 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Accelerating Deep Neuroevolution on Distributed FPGAs for Reinforcement Learning Problems	May 10, 2020	Atari GamesComputational Efficiency	—Unverified
An FPGA-Based On-Device Reinforcement Learning Approach using Online Sequential Learning	May 10, 2020	L2 RegularizationOpenAI Gym	—Unverified
Reinforcement Learning for Thermostatically Controlled Loads Control using Modelica and Python	May 9, 2020	Q-Learningreinforcement-learning	—Unverified
Synthesizing Safe Policies under Probabilistic Constraints with Reinforcement Learning and Bayesian Model Checking	May 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Is Deep Reinforcement Learning Ready for Practical Applications in Healthcare? A Sensitivity Analysis of Duel-DDQN for Hemodynamic Management in Sepsis Patients	May 8, 2020	Deep Reinforcement LearningManagement	—Unverified

Show:10 25 50

← PrevPage 220 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified