Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4226–4250 of 15113 papers

Title	Date	Tasks	Status	Score
Regularized Anderson Acceleration for Off-Policy Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available	5
Tractable Reinforcement Learning of Signal Temporal Logic Objectives	Jan 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
On Improving Deep Reinforcement Learning for POMDPs	Apr 26, 2017	Atari GamesDecision Making	CodeCode Available	5
ROER: Regularized Optimal Experience Replay	Jul 4, 2024	continuous-controlContinuous Control	CodeCode Available	5
Rogue-Gym: A New Challenge for Generalization in Reinforcement Learning	Apr 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
ROLeR: Effective Reward Shaping in Offline Reinforcement Learning for Recommender Systems	Jul 18, 2024	Offline RLRecommendation Systems	CodeCode Available	5
Training Adversarial Agents to Exploit Weaknesses in Deep Control Policies	Feb 27, 2020	Autonomous DrivingAutonomous Vehicles	CodeCode Available	5
Training Agents using Upside-Down Reinforcement Learning	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Mode-constrained Model-based Reinforcement Learning via Gaussian Processes	Jul 25, 2023	Gaussian ProcessesModel-based Reinforcement Learning	CodeCode Available	5
Training an Interactive Humanoid Robot Using Multimodal Deep Reinforcement Learning	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
NARS vs. Reinforcement learning: ONA vs. Q-Learning	Dec 23, 2022	Q-Learningreinforcement-learning	CodeCode Available	5
ROS2Learn: a reinforcement learning framework for ROS 2	Mar 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Rotation, Translation, and Cropping for Zero-Shot Generalization	Jan 27, 2020	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
Training Transition Policies via Distribution Matching for Complex Tasks	Oct 8, 2021	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available	5
TrajDeleter: Enabling Trajectory Forgetting in Offline Reinforcement Learning Agents	Apr 18, 2024	energy managementOffline RL	CodeCode Available	5
Trajectory-Aware Eligibility Traces for Off-Policy Reinforcement Learning	Jan 26, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Trajectory-Based Off-Policy Deep Reinforcement Learning	May 14, 2019	continuous-controlContinuous Control	CodeCode Available	5
Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement Learning	Jun 14, 2022	continuous-controlContinuous Control	CodeCode Available	5
Regularizing Neural Networks by Penalizing Confident Output Distributions	Jan 23, 2017	General Classificationimage-classification	CodeCode Available	5
RUDDER: Return Decomposition for Delayed Rewards	Jun 20, 2018	Atari Gamesreinforcement-learning	CodeCode Available	5
Rule Augmented Unsupervised Constituency Parsing	May 21, 2021	Constituency Parsingreinforcement-learning	CodeCode Available	5
Regularizing Neural Networks for Future Trajectory Prediction via Inverse Reinforcement Learning Framework	Jul 10, 2019	Decoderreinforcement-learning	CodeCode Available	5
On Instrumental Variable Regression for Deep Offline Policy Evaluation	May 21, 2021	regressionReinforcement Learning (RL)	CodeCode Available	5
Run, skeleton, run: skeletal model in a physics-based simulation	Nov 18, 2017	NavigatePolicy Gradient Methods	CodeCode Available	5
ReinBo: Machine Learning pipeline search and configuration with Bayesian Optimization embedded Reinforcement Learning	Apr 10, 2019	Bayesian OptimizationBIG-bench Machine Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 170 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified