Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1625 of 15113 papers

Title	Date	Tasks	Status	Hype
MELD: Meta-Reinforcement Learning from Images via Latent State Models	Oct 26, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available	1
Memory-Augmented Reinforcement Learning for Image-Goal Navigation	Jan 13, 2021	Data AugmentationNavigate	CodeCode Available	1
Memory-efficient Reinforcement Learning with Value-based Knowledge Consolidation	May 22, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Memory-Enhanced Neural Solvers for Efficient Adaptation in Combinatorial Optimization	Jun 24, 2024	Combinatorial OptimizationReinforcement Learning (RL)	CodeCode Available	1
Communicative Reinforcement Learning Agents for Landmark Detection in Brain Images	Aug 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Conditional Mutual Information for Disentangled Representations in Reinforcement Learning	May 23, 2023	continuous-controlContinuous Control	CodeCode Available	1
Meta-Reinforcement Learning of Structured Exploration Strategies	Feb 20, 2018	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Meta Reinforcement Learning with Autonomous Inference of Subtask Dependencies	Jan 1, 2020	Efficient ExplorationMeta Reinforcement Learning	CodeCode Available	1
Continual Model-Based Reinforcement Learning with Hypernetworks	Sep 25, 2020	Continual Learningmodel	CodeCode Available	1
CURL: Contrastive Unsupervised Representation Learning for Reinforcement Learning	Jan 1, 2020	Contrastive Learningreinforcement-learning	CodeCode Available	1
An Encoder-Decoder Based Audio Captioning System With Transfer and Reinforcement Learning	Aug 5, 2021	Audio captioningDecoder	CodeCode Available	1
METRA: Scalable Unsupervised RL with Metric-Aware Abstraction	Oct 13, 2023	Reinforcement Learning (RL)Unsupervised Pre-training	CodeCode Available	1
Mildly Conservative Q-Learning for Offline Reinforcement Learning	Jun 9, 2022	D4RLQ-Learning	CodeCode Available	1
Mind the Gap: Offline Policy Optimization for Imperfect Rewards	Feb 3, 2023	Reinforcement Learning (RL)	CodeCode Available	1
Collaborative Multi-Agent Dialogue Model Training Via Reinforcement Learning	Jul 11, 2019	Natural Language Understandingreinforcement-learning	CodeCode Available	1
Mirror Learning: A Unifying Framework of Policy Optimisation	Jan 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Asynchronous Multi-Agent Reinforcement Learning for Efficient Real-Time Multi-Robot Cooperative Exploration	Jan 9, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Mitigating Adversarial Perturbations for Deep Reinforcement Learning via Vector Quantization	Oct 4, 2024	Deep Reinforcement LearningQuantization	CodeCode Available	1
Coevolving with the Other You: Fine-Tuning LLM with Sequential Cooperative Multi-Agent Reinforcement Learning	Oct 8, 2024	GSM8KMulti-agent Reinforcement Learning	CodeCode Available	1
COG: Connecting New Skills to Past Experience with Offline Reinforcement Learning	Oct 27, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Mobility-Aware Cooperative Caching in Vehicular Edge Computing Based on Asynchronous Federated and Deep Reinforcement Learning	Aug 2, 2022	Deep Reinforcement LearningEdge-computing	CodeCode Available	1
Mitigating Open-Vocabulary Caption Hallucinations	Dec 6, 2023	DiversityHallucination	CodeCode Available	1
A Versatile and Efficient Reinforcement Learning Framework for Autonomous Driving	Oct 22, 2021	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Model-Based Active Exploration	Oct 29, 2018	Efficient Explorationmodel	CodeCode Available	1
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning	May 24, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 65 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified