Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10026–10050 of 15113 papers

Title	Date	Tasks	Status	Hype
Chrome Dino Run using Reinforcement Learning	Aug 15, 2020	Q-Learningreinforcement-learning	—Unverified	0
Autonomous Braking and Throttle System: A Deep Reinforcement Learning Approach for Naturalistic Driving	Aug 15, 2020	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Cautious Adaptation For Reinforcement Learning in Safety-Critical Settings	Aug 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Explainability in Deep Reinforcement Learning	Aug 15, 2020	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified	0
Safe Reinforcement Learning in Constrained Markov Decision Processes	Aug 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reinforcement Learning with Quantum Variational Circuits	Aug 15, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	CodeCode Available	0
Model-Free Optimal Control of Linear Multi-Agent Systems via Decomposition and Hierarchical Approximation	Aug 14, 2020	ClusteringGraph Clustering	—Unverified	0
OR-Gym: A Reinforcement Learning Library for Operations Research Problems	Aug 14, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Sample-efficient Cross-Entropy Method for Real-time Planning	Aug 14, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Decision-making at Unsignalized Intersection for Autonomous Vehicles: Left-turn Maneuver with Deep Reinforcement Learning	Aug 14, 2020	Autonomous VehiclesDecision Making	—Unverified	0
Adversary Agnostic Robust Deep Reinforcement Learning	Aug 14, 2020	Adversarial RobustnessAtari Games	—Unverified	0
Multi-Agent Deep Reinforcement Learning enabled Computation Resource Allocation in a Vehicular Cloud Network	Aug 14, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Visuomotor Mechanical Search: Learning to Retrieve Target Objects in Clutter	Aug 13, 2020	Deep Reinforcement LearningObject	—Unverified	0
Robust Image Matching By Dynamic Feature Selection	Aug 13, 2020	Decision Makingfeature selection	—Unverified	0
Offline Meta-Reinforcement Learning with Advantage Weighting	Aug 13, 2020	Machine TranslationMeta-Learning	CodeCode Available	1
Reinforcement Learning with Trajectory Feedback	Aug 13, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A Review of Deep Reinforcement Learning for Smart Building Energy Management	Aug 12, 2020	Deep Reinforcement Learningenergy management	—Unverified	0
An ocular biomechanics environment for reinforcement learning	Aug 12, 2020	Deep Reinforcement LearningPosition	—Unverified	0
Overcoming Model Bias for Robust Offline Deep Reinforcement Learning	Aug 12, 2020	continuous-controlContinuous Control	—Unverified	0
Model-Based Offline Planning	Aug 12, 2020	modelOffline RL	—Unverified	0
Deep Model-Based Reinforcement Learning for High-Dimensional Problems, a Survey	Aug 11, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
An Intelligent Control Strategy for buck DC-DC Converter via Deep Reinforcement Learning	Aug 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Batch Value-function Approximation with Only Realizability	Aug 11, 2020	Model SelectionReinforcement Learning (RL)	CodeCode Available	0
Comparison of Model Predictive and Reinforcement Learning Methods for Fault Tolerant Control	Aug 10, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Fault-Tolerant Control of Degrading Systems with On-Policy Reinforcement Learning	Aug 10, 2020	Fault Detectionreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 402 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified