Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5326–5350 of 15113 papers

Title	Date	Tasks	Status	Hype
Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement Learning	Jun 24, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning under Partial Observability Guided by Learned Environment Models	Jun 23, 2022	Q-Learningreinforcement-learning	—Unverified	0
Recursive Reinforcement Learning	Jun 23, 2022	IngenuityQ-Learning	—Unverified	0
The Real Deal: A Review of Challenges and Opportunities in Moving Reinforcement Learning-Based Traffic Signal Control Systems Towards Reality	Jun 23, 2022	Reinforcement Learning (RL)Traffic Signal Control	—Unverified	0
Nearly Minimax Optimal Reinforcement Learning with Linear Function Approximation	Jun 23, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos	Jun 23, 2022	Imitation LearningMinecraft	CodeCode Available	3
Learning Agile Skills via Adversarial Imitation of Rough Partial Demonstrations	Jun 23, 2022	Reinforcement Learning (RL)	—Unverified	0
CGAR: Critic Guided Action Redistribution in Reinforcement Leaning	Jun 23, 2022	MuJoCoReinforcement Learning (RL)	CodeCode Available	0
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified	0
Multi-Agent Car Parking using Reinforcement Learning	Jun 22, 2022	Autonomous DrivingForm	CodeCode Available	1
Optimistic Linear Support and Successor Features as a Basis for Optimal Policy Transfer	Jun 22, 2022	Reinforcement Learning (RL)Transfer Learning	CodeCode Available	0
Constrained Stochastic Nonconvex Optimization with State-dependent Markov Data	Jun 22, 2022	Reinforcement Learning (RL)Stochastic Optimization	—Unverified	0
PAC: Assisted Value Factorisation with Counterfactual Predictions in Multi-Agent Reinforcement Learning	Jun 22, 2022	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	0
Auto-Encoding Adversarial Imitation Learning	Jun 22, 2022	Decision MakingImitation Learning	—Unverified	0
Multi-Horizon Representations with Hierarchical Forward Models for Reinforcement Learning	Jun 22, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Decentralized Gossip-Based Stochastic Bilevel Optimization over Communication Networks	Jun 22, 2022	Bilevel OptimizationFederated Learning	—Unverified	0
Curious Exploration via Structured World Models Yields Zero-Shot Object Manipulation	Jun 22, 2022	Efficient ExplorationObject	—Unverified	0
Fusion of Model-free Reinforcement Learning with Microgrid Control: Review and Vision	Jun 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning Optimal Treatment Strategies for Sepsis Using Offline Reinforcement Learning in Continuous Space	Jun 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Turbulence Modeling in Large Eddy Simulations	Jun 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Imitate then Transcend: Multi-Agent Optimal Execution with Dual-Window Denoise PPO	Jun 21, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Meta Reinforcement Learning with Finite Training Tasks -- a Density Estimation Approach	Jun 21, 2022	Density EstimationDimensionality Reduction	CodeCode Available	0
On the Statistical Efficiency of Reward-Free Exploration in Non-Linear RL	Jun 21, 2022	Reinforcement Learning (RL)	—Unverified	0
Robust Task Representations for Offline Meta-Reinforcement Learning via Contrastive Learning	Jun 21, 2022	Contrastive LearningMeta Reinforcement Learning	CodeCode Available	1
Safe and Psychologically Pleasant Traffic Signal Control with Reinforcement Learning using Action Masking	Jun 21, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 214 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified