Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4125 of 15113 papers

Title	Date	Tasks	Status	Score
TorchBeast: A PyTorch Platform for Distributed RL	Oct 8, 2019	OpenAI GymReinforcement Learning	CodeCode Available	5
TorchProteinLibrary: A computationally efficient, differentiable representation of protein structure	Nov 23, 2018	Protein FoldingReinforcement Learning (RL)	CodeCode Available	5
RL-PGO: Reinforcement Learning-based Planar Pose-Graph Optimization	Feb 26, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
RLPP: A Residual Method for Zero-Shot Real-World Autonomous Racing on Scaled Platforms	Jan 28, 2025	Autonomous RacingReinforcement Learning (RL)	CodeCode Available	5
To the Max: Reinventing Reward in Reinforcement Learning	Feb 2, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Molecular De Novo Design through Deep Reinforcement Learning	Apr 25, 2017	Activity PredictionDeep Reinforcement Learning	CodeCode Available	5
Toward Causal-Aware RL: State-Wise Action-Refined Temporal Difference	Jan 2, 2022	continuous-controlContinuous Control	CodeCode Available	5
Toward Collaborative Reinforcement Learning Agents that Communicate Through Text-Based Natural Language	Jul 20, 2021	Navigatereinforcement-learning	CodeCode Available	5
RLScheduler: An Automated HPC Batch Job Scheduler Using Reinforcement Learning	Oct 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Paying Attention to Function Words	Sep 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Toward Policy Explanations for Multi-Agent Reinforcement Learning	Apr 26, 2022	Autonomous DrivingDecision Making	CodeCode Available	5
RLTutor: Reinforcement Learning Based Adaptive Tutoring System by Modeling Virtual Student with Fewer Interactions	Jul 31, 2021	Decision Makingreinforcement-learning	CodeCode Available	5
RL Unplugged: A Collection of Benchmarks for Offline Reinforcement Learning	Dec 1, 2020	Offline RLreinforcement-learning	CodeCode Available	5
RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning	Jun 24, 2020	Atari GamesDQN Replay Dataset	CodeCode Available	5
Towards a Common Implementation of Reinforcement Learning for Multiple Robotic Tasks	Feb 21, 2017	Decision Makingreinforcement-learning	CodeCode Available	5
Reasoning about Counterfactuals to Improve Human Inverse Reinforcement Learning	Mar 3, 2022	counterfactualCounterfactual Reasoning	CodeCode Available	5
Reasoning and Generalization in RL: A Tool Use Perspective	Jul 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Reasoning Under 1 Billion: Memory-Augmented Reinforcement Learning for Large Language Models	Apr 3, 2025	GSM8KReinforcement Learning (RL)	CodeCode Available	5
Towards a Reinforcement Learning Environment Toolbox for Intelligent Electric Motor Control	Oct 21, 2019	Model Predictive ControlOpenAI Gym	CodeCode Available	5
ROBEL: Robotics Benchmarks for Learning with Low-Cost Robots	Sep 25, 2019	continuous-controlContinuous Control	CodeCode Available	5
PC-MLP: Model-based Reinforcement Learning with Policy Cover Guided Exploration	Jul 15, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	5
Towards Augmented Microscopy with Reinforcement Learning-Enhanced Workflows	Aug 4, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Robofriend: An Adpative Storytelling Robotic Teddy Bear - Technical Report	Jan 4, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
reBandit: Random Effects based Online RL algorithm for Reducing Cannabis Use	Feb 27, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Margin Trader: A Reinforcement Learning Framework for Portfolio Management with Margin and Constraints	Nov 25, 2023	Deep Reinforcement LearningManagement	CodeCode Available	5

Show:10 25 50

← PrevPage 165 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified