Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1825 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Feasibility Consistent Representation Learning for Safe Reinforcement Learning	May 20, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Benchmarking Batch Deep Reinforcement Learning Algorithms	Oct 3, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1	5
Automatic Truss Design with Reinforcement Learning	Jun 27, 2023	Combinatorial OptimizationLayout Design	CodeCode Available	1	5
Fast Template Matching and Update for Video Object Tracking and Segmentation	Apr 16, 2020	Object Trackingreinforcement-learning	CodeCode Available	1	5
Hybrid intelligence for dynamic job-shop scheduling with deep reinforcement learning and attention mechanism	Jan 3, 2022	Deep Reinforcement LearningGraph Representation Learning	CodeCode Available	1	5
Fault-Tolerant Federated Reinforcement Learning with Theoretical Guarantee	Oct 26, 2021	Decision MakingFederated Learning	CodeCode Available	1	5
ACN-Sim: An Open-Source Simulator for Data-Driven Electric Vehicle Charging Research	Dec 4, 2020	OpenAI GymReinforcement Learning (RL)	CodeCode Available	1	5
Automating DBSCAN via Deep Reinforcement Learning	Aug 9, 2022	ClusteringComputational Efficiency	CodeCode Available	1	5
Benchmarking Constraint Inference in Inverse Reinforcement Learning	Jun 20, 2022	Autonomous DrivingBenchmarking	CodeCode Available	1	5
Hybrid Inverse Reinforcement Learning	Feb 13, 2024	continuous-controlContinuous Control	CodeCode Available	1	5
Federated Ensemble-Directed Offline Reinforcement Learning	May 4, 2023	continuous-controlContinuous Control	CodeCode Available	1	5
Rethinking the Implementation Matters in Cooperative Multi-Agent Reinforcement Learning	Feb 6, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Federated Reinforcement Learning with Environment Heterogeneity	Apr 6, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
FedFormer: Contextual Federation with Attention in Reinforcement Learning	May 27, 2022	Federated Learningreinforcement-learning	CodeCode Available	1	5
ImagineBench: Evaluating Reinforcement Learning with Large Language Model Rollouts	May 15, 2025	Continual LearningLanguage Modeling	CodeCode Available	1	5
Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors	Jan 9, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Reinforcement Learning with Combinatorial Actions: An Application to Vehicle Routing	Oct 22, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1	5
Reinforcement learning with combinatorial actions for coupled restless bandits	Mar 1, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Finding Effective Security Strategies through Reinforcement Learning and Self-Play	Sep 17, 2020	Common Sense Reasoningreinforcement-learning	CodeCode Available	1	5
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Finding Failures in High-Fidelity Simulation using Adaptive Stress Testing and the Backward Algorithm	Jul 27, 2021	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	1	5
Fine-Grained Causal Dynamics Learning with Quantization for Improving Robustness in Reinforcement Learning	Jun 5, 2024	QuantizationReinforcement Learning (RL)	CodeCode Available	1	5
A coevolutionary approach to deep multi-agent reinforcement learning	Apr 12, 2021	Atari GamesDecision Making	CodeCode Available	1	5
How Far I'll Go: Offline Goal-Conditioned Reinforcement Learning via f-Advantage Regression	Jun 7, 2022	regressionreinforcement-learning	CodeCode Available	1	5
Behavior Proximal Policy Optimization	Feb 22, 2023	D4RLOffline RL	CodeCode Available	1	5

Show:10 25 50

← PrevPage 73 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified