Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4626–4650 of 15113 papers

Title	Date	Tasks	Status	Score
Predicting Real-time Scientific Experiments Using Transformer models and Reinforcement Learning	Apr 25, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Predicting Research Trends From Arxiv	Mar 7, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
XCS as a reinforcement learning approach to automatic test case prioritization	Jul 12, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
XCSF for Automatic Test Case Prioritization	Nov 4, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
XIRL: Cross-embodiment Inverse Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Sequential memory improves sample and memory efficiency in Episodic Control	Dec 29, 2021	Deep Reinforcement LearningHippocampus	CodeCode Available	5
Reinforcement Learning for Robotic Manipulation using Simulated Locomotion Demonstrations	Oct 16, 2019	Objectreinforcement-learning	CodeCode Available	5
xSRL: Safety-Aware Explainable Reinforcement Learning -- Safety as a Product of Explainability	Dec 26, 2024	Autonomous VehiclesReinforcement Learning (RL)	CodeCode Available	5
Sequential Recommendation for Optimizing Both Immediate Feedback and Long-term Retention	Apr 4, 2024	Contrastive LearningMulti-Task Learning	CodeCode Available	5
Reinforcement Learning for Robot Navigation with Adaptive Forward Simulation Time (AFST) in a Semi-Markov Model	Aug 13, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
On the Reuse Bias in Off-Policy Reinforcement Learning	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	5
Low Emission Building Control with Zero-Shot Reinforcement Learning	Jun 28, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Zero-shot cross-modal transfer of Reinforcement Learning policies through a Global Workspace	Mar 7, 2024	AttributeContrastive Learning	CodeCode Available	5
Neural Reward Machines	Aug 16, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures	Jul 1, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
Neural Sequence Model Training via α-divergence Minimization	Jun 30, 2017	Machine Translationmodel	CodeCode Available	5
Zero-Shot Reinforcement Learning via Function Encoders	Jan 30, 2024	Decision Makingreinforcement-learning	CodeCode Available	5
Neural SLAM: Learning to Explore with External Memory	Jun 29, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Setting up a Reinforcement Learning Task with a Real-World Robot	Mar 19, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
Zero-Shot Task Generalization with Multi-Task Deep Reinforcement Learning	Jun 15, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Multi-Agent Reinforcement Learning: A Report on Challenges and Approaches	Jul 25, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning	Dec 31, 2021	Atari GamesMeta Reinforcement Learning	CodeCode Available	5
Zeroth-Order Actor-Critic: An Evolutionary Framework for Sequential Decision Problems	Jan 29, 2022	continuous-controlContinuous Control	CodeCode Available	5
Reinforcement Learning for Solving Stochastic Vehicle Routing Problem	Nov 13, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 186 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified