Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1175 of 15113 papers

Title	Date	Tasks	Status	Hype
Asynchronous Reinforcement Learning for Real-Time Control of Physical Robots	Mar 23, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Possibility Before Utility: Learning And Using Hierarchical Affordances	Mar 23, 2022	Hierarchical Reinforcement LearningNavigate	CodeCode Available	1
Quantum Multi-Agent Reinforcement Learning via Variational Quantum Circuit Design	Mar 20, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
Reinforcement learning for automatic quadrilateral mesh generation: a soft actor-critic approach	Mar 19, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Teachable Reinforcement Learning via Advice Distillation	Mar 19, 2022	Decision MakingImitation Learning	CodeCode Available	1
PMIC: Improving Multi-Agent Reinforcement Learning with Progressive Mutual Information Collaboration	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Latent-Variable Advantage-Weighted Policy Optimization for Offline RL	Mar 16, 2022	continuous-controlContinuous Control	CodeCode Available	1
CTDS: Centralized Teacher with Decentralized Student for Multi-Agent Reinforcement Learning	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Zipfian environments for Reinforcement Learning	Mar 15, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
The Health Gym: Synthetic Health-Related Datasets for the Development of Reinforcement Learning Algorithms	Mar 12, 2022	BIG-bench Machine LearningGenerative Adversarial Network	CodeCode Available	1
Multi-Objective reward generalization: Improving performance of Deep Reinforcement Learning for applications in single-asset trading	Mar 9, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Curriculum-based Reinforcement Learning for Distribution System Critical Load Restoration	Mar 8, 2022	Decision Makingreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning for Entity Alignment	Mar 7, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Reliably Re-Acting to Partner's Actions with the Social Intrinsic Motivation of Transfer Empowerment	Mar 7, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Influencing Long-Term Behavior in Multiagent Reinforcement Learning	Mar 7, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Testing Stationarity and Change Point Detection in Reinforcement Learning	Mar 3, 2022	Change Point Detectionreinforcement-learning	CodeCode Available	1
Affordance Learning from Play for Sample-Efficient Policy Learning	Mar 1, 2022	Deep Reinforcement LearningMotion Planning	CodeCode Available	1
Avalanche RL: a Continual Reinforcement Learning Library	Feb 28, 2022	Continual LearningOpenAI Gym	CodeCode Available	1
Combining Modular Skills in Multitask Learning	Feb 28, 2022	Instruction Followingreinforcement-learning	CodeCode Available	1
Monkey Business: Reinforcement learning meets neighborhood search for Virtual Network Embedding	Feb 28, 2022	Network Embeddingreinforcement-learning	CodeCode Available	1
Building a 3-Player Mahjong AI using Deep Reinforcement Learning	Feb 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
All You Need Is Supervised Learning: From Imitation Learning to Meta-RL With Upside Down RL	Feb 24, 2022	AllImitation Learning	CodeCode Available	1
Blockchain Framework for Artificial Intelligence Computation	Feb 23, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Using Deep Reinforcement Learning with Automatic Curriculum Learning for Mapless Navigation in Intralogistics	Feb 23, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning	Feb 23, 2022	D4RLOffline RL	CodeCode Available	1

Show:10 25 50

← PrevPage 47 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified