Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9101–9125 of 15113 papers

Title	Date	Tasks	Status
What is Going on Inside Recurrent Meta Reinforcement Learning Agents?	Apr 29, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
Pre-training of Deep RL Agents for Improved Learning under Domain Randomization	Apr 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adversarial Inverse Reinforcement Learning for Mean Field Games	Apr 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Using Meta Reinforcement Learning to Bridge the Gap between Simulation and Experiment in Energy Demand Response	Apr 29, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Medium Access using Distributed Reinforcement Learning for IoTs with Low-Complexity Wireless Transceivers	Apr 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adapting to Reward Progressivity via Spectral Reinforcement Learning	Apr 29, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Emotional Contagion-Aware Deep Reinforcement Learning for Antagonistic Crowd Simulation	Apr 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Hypernetwork Dismantling via Deep Reinforcement Learning	Apr 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning	Apr 28, 2021	Deep Reinforcement LearningNavigate	—Unverified
A Generalized Projected Bellman Error for Off-policy Value Estimation in Reinforcement Learning	Apr 28, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Reinforcement Learning Environment for Polyhedral Optimizations	Apr 28, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
Reward (Mis)design for Autonomous Driving	Apr 28, 2021	Autonomous Drivingreinforcement-learning	—Unverified
Semi-On-Policy Training for Sample Efficient Multi-Agent Policy Gradients	Apr 27, 2021	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Implementing Reinforcement Learning Algorithms in Retail Supply Chains with OpenAI Gym Toolkit	Apr 27, 2021	Demand ForecastingManagement	—Unverified
Controlling earthquake-like instabilities using artificial intelligence	Apr 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Adversarial Training for Meta Reinforcement Learning	Apr 27, 2021	Generative Adversarial NetworkMeta-Learning	—Unverified
ANT: Learning Accurate Network Throughput for Better Adaptive Video Streaming	Apr 26, 2021	Reinforcement Learning (RL)	—Unverified
End-to-end grasping policies for human-in-the-loop robots via deep reinforcement learning	Apr 26, 2021	Deep Reinforcement LearningElectromyography (EMG)	CodeCode Available
A Deep Reinforcement Learning Approach for the Meal Delivery Problem	Apr 24, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
DisCo RL: Distribution-Conditioned Reinforcement Learning for General-Purpose Policies	Apr 23, 2021	reinforcement-learningReinforcement Learning	—Unverified
Safe Chance Constrained Reinforcement Learning for Batch Process Control	Apr 23, 2021	Gaussian ProcessesModel Predictive Control	CodeCode Available
Reinforcement Learning using Guided Observability	Apr 22, 2021	Decision MakingMuJoCo	—Unverified
Reset-Free Reinforcement Learning via Multi-Task Learning: Learning Dexterous Manipulation Behaviors without Human Intervention	Apr 22, 2021	Multi-Task LearningReinforcement Learning (RL)	—Unverified
Formula RL: Deep Reinforcement Learning for Autonomous Racing using Telemetry Data	Apr 22, 2021	Autonomous RacingDeep Reinforcement Learning	—Unverified
A learning gap between neuroscience and reinforcement learning	Apr 22, 2021	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 365 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified