Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1175 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Electric Vehicle Routing Problem for Emergency Power Supply: Towards Telecom Base Station Relief	Apr 3, 2024	Reinforcement Learning (RL)	CodeCode Available	1	5
AutoPhoto: Aesthetic Photo Capture using Reinforcement Learning	Sep 21, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
AutoPhase: Compiler Phase-Ordering for High Level Synthesis with Deep Reinforcement Learning	Jan 15, 2019	Deep Reinforcement LearningHigh-Level Synthesis	CodeCode Available	1	5
A Deep Reinforcement Learning Approach to Marginalized Importance Sampling with the Successor Representation	Jun 12, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1	5
Basis for Intentions: Efficient Inverse Reinforcement Learning using Past Experience	Aug 9, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Barrier Certified Safety Learning Control: When Sum-of-Square Programming Meets Reinforcement Learning	Jun 16, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Enforcing Policy Feasibility Constraints through Differentiable Projection for Energy Optimization	May 19, 2021	Reinforcement Learning (RL)	CodeCode Available	1	5
Batch Exploration with Examples for Scalable Robotic Reinforcement Learning	Oct 22, 2020	Offline RLreinforcement-learning	CodeCode Available	1	5
AutoPhase: Juggling HLS Phase Orderings in Random Forests with Deep Reinforcement Learning	Mar 2, 2020	Deep Reinforcement LearningHigh-Level Synthesis	CodeCode Available	1	5
Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning	Nov 4, 2018	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1	5
A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem	Jun 30, 2017	Deep Reinforcement LearningManagement	CodeCode Available	1	5
BayesSimIG: Scalable Parameter Inference for Adaptive Domain Randomization with IsaacGym	Jul 9, 2021	GPUReinforcement Learning (RL)	CodeCode Available	1	5
Eigenoption Discovery through the Deep Successor Representation	Oct 30, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	1	5
End-to-End Urban Driving by Imitating a Reinforcement Learning Coach	Aug 18, 2021	Autonomous DrivingImitation Learning	CodeCode Available	1	5
Enhancing Graph Neural Network-based Fraud Detectors against Camouflaged Fraudsters	Aug 19, 2020	Anomaly DetectionFraud Detection	CodeCode Available	1	5
Enhancing LLM Reasoning with Iterative DPO: A Comprehensive Empirical Investigation	Mar 17, 2025	Mathematical ReasoningReinforcement Learning (RL)	CodeCode Available	1	5
Efficient Risk-Averse Reinforcement Learning	May 10, 2022	Autonomous Drivingreinforcement-learning	CodeCode Available	1	5
Autonomous Racing using a Hybrid Imitation-Reinforcement Learning Architecture	Oct 11, 2021	Autonomous RacingAutonomous Vehicles	CodeCode Available	1	5
Enhancing SAT solvers with glue variable predictions	Jul 6, 2020	CPUGPU	CodeCode Available	1	5
Efficient Symptom Inquiring and Diagnosis via Adaptive Alignment of Reinforcement Learning and Classification	Dec 1, 2021	Decision MakingDiagnostic	CodeCode Available	1	5
An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic Manipulation with Pybullet	May 12, 2021	MuJoCoMulti-Goal Reinforcement Learning	CodeCode Available	1	5
Behavior From the Void: Unsupervised Active Pre-Training	Mar 8, 2021	Atari GamesReinforcement Learning (RL)	CodeCode Available	1	5
Entropy-Regularized Process Reward Model	Dec 15, 2024	GSM8KMath	CodeCode Available	1	5
Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement	Feb 9, 2024	Code GenerationDecision Making	CodeCode Available	1	5
Efficient Reinforcement Learning in Block MDPs: A Model-free Representation Learning Approach	Jan 31, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5

Show:10 25 50

← PrevPage 47 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified