Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1160 of 15113 papers

Title	Date	Tasks	Status	Hype
Possibility Before Utility: Learning And Using Hierarchical Affordances	Mar 23, 2022	Hierarchical Reinforcement LearningNavigate	CodeCode Available	1
Asynchronous Reinforcement Learning for Real-Time Control of Physical Robots	Mar 23, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Quantum Multi-Agent Reinforcement Learning via Variational Quantum Circuit Design	Mar 20, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
Teachable Reinforcement Learning via Advice Distillation	Mar 19, 2022	Decision MakingImitation Learning	CodeCode Available	1
Reinforcement learning for automatic quadrilateral mesh generation: a soft actor-critic approach	Mar 19, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
CTDS: Centralized Teacher with Decentralized Student for Multi-Agent Reinforcement Learning	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Latent-Variable Advantage-Weighted Policy Optimization for Offline RL	Mar 16, 2022	continuous-controlContinuous Control	CodeCode Available	1
PMIC: Improving Multi-Agent Reinforcement Learning with Progressive Mutual Information Collaboration	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Zipfian environments for Reinforcement Learning	Mar 15, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
The Health Gym: Synthetic Health-Related Datasets for the Development of Reinforcement Learning Algorithms	Mar 12, 2022	BIG-bench Machine LearningGenerative Adversarial Network	CodeCode Available	1

Show:10 25 50

← PrevPage 116 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified