Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–925 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Continuous control with deep reinforcement learning	Sep 9, 2015	Action Detectioncontinuous-control	CodeCode Available	1	5
Continuous Coordination As a Realistic Scenario for Lifelong Learning	Mar 4, 2021	Continual LearningDeep Reinforcement Learning	CodeCode Available	1	5
Discovering Reinforcement Learning Algorithms	Jul 17, 2020	Atari GamesMeta-Learning	CodeCode Available	1	5
Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations	Jul 20, 2022	Imitation LearningOffline RL	CodeCode Available	1	5
Contrastive Energy Prediction for Exact Energy-Guided Diffusion Sampling in Offline Reinforcement Learning	Apr 25, 2023	D4RLImage Generation	CodeCode Available	1	5
Continuous MDP Homomorphisms and Homomorphic Policy Gradient	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1	5
Goal-Conditioned Generators of Deep Policies	Jul 4, 2022	continuous-controlContinuous Control	CodeCode Available	1	5
Goal-Conditioned Reinforcement Learning: Problems and Solutions	Jan 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Contrastive Active Inference	Oct 19, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Distributed Control of Partial Differential Equations Using Convolutional Reinforcement Learning	Jan 25, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
A coevolutionary approach to deep multi-agent reinforcement learning	Apr 12, 2021	Atari GamesDecision Making	CodeCode Available	1	5
Contrastive Preference Learning: Learning from Human Feedback without RL	Oct 20, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Contrastive Retrospection: honing in on critical steps for rapid learning and generalization in RL	Oct 12, 2022	Contrastive LearningOut-of-Distribution Generalization	CodeCode Available	1	5
Contrastive State Augmentations for Reinforcement Learning-Based Recommender Systems	May 18, 2023	Recommendation Systemsreinforcement-learning	CodeCode Available	1	5
Gradient Imitation Reinforcement Learning for Low Resource Relation Extraction	Sep 14, 2021	Meta-LearningPseudo Label	CodeCode Available	1	5
Contrastive Variational Reinforcement Learning for Complex Observations	Aug 6, 2020	Atari GamesContinuous Control	CodeCode Available	1	5
Controlgym: Large-Scale Control Environments for Benchmarking Reinforcement Learning Algorithms	Nov 30, 2023	BenchmarkingOpenAI Gym	CodeCode Available	1	5
Control-Informed Reinforcement Learning for Chemical Processes	Aug 24, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Graph Convolution-Based Deep Reinforcement Learning for Multi-Agent Decision-Making in Mixed Traffic Environments	Jan 30, 2022	Autonomous VehiclesDecision Making	CodeCode Available	1	5
Controlling the Risk of Conversational Search via Reinforcement Learning	Jan 15, 2021	Conversational Searchreinforcement-learning	CodeCode Available	1	5
Graph Neural Network Reinforcement Learning for Autonomous Mobility-on-Demand Systems	Apr 23, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Adversarial Deep Reinforcement Learning in Portfolio Management	Aug 29, 2018	Deep Reinforcement LearningManagement	CodeCode Available	1	5
Adversarial Deep Reinforcement Learning for Improving the Robustness of Multi-agent Autonomous Driving Policies	Dec 22, 2021	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	1	5
Control-Oriented Model-Based Reinforcement Learning with Implicit Differentiation	Jun 6, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Accelerating Exploration with Unlabeled Prior Data	Nov 9, 2023	Reinforcement Learning (RL)	CodeCode Available	1	5

Show:10 25 50

← PrevPage 37 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified