Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13751–13800 of 15113 papers

Title	Date	Tasks	Status
Uncertainty-driven Trajectory Truncation for Data Augmentation in Offline Reinforcement Learning	Apr 10, 2023	D4RLData Augmentation	CodeCode Available
On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
TAdam: A Robust Stochastic Gradient Optimizer	Feb 29, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
DC4L: Distribution Shift Recovery via Data-Driven Control for Deep Learning Models	Feb 20, 2023	Data AugmentationDimensionality Reduction	CodeCode Available
Model-Ensemble Trust-Region Policy Optimization	Feb 28, 2018	continuous-controlContinuous Control	CodeCode Available
MEET: A Monte Carlo Exploration-Exploitation Trade-off for Buffer Sampling	Oct 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
WOFOSTGym: A Crop Simulator for Learning Annual and Perennial Crop Management Strategies	Feb 26, 2025	Decision MakingManagement	CodeCode Available
Towards Interpretable Reinforcement Learning Using Attention Augmented Agents	Jun 6, 2019	Image CaptioningQuestion Answering	CodeCode Available
Provably Correct Optimization and Exploration with Non-linear Policies	Mar 22, 2021	Reinforcement Learning (RL)	CodeCode Available
Visualizing and Understanding Atari Agents	Oct 31, 2017	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Monte Carlo Q-learning for General Game Playing	Feb 16, 2018	Board GamesQ-Learning	CodeCode Available
Taming the Noise in Reinforcement Learning via Soft Updates	Dec 28, 2015	Q-Learningreinforcement-learning	CodeCode Available
On the Convergence Theory of Debiased Model-Agnostic Meta-Reinforcement Learning	Feb 12, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available
Measuring the Reliability of Reinforcement Learning Algorithms	Dec 10, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Semifactual Explanations for Reinforcement Learning	Sep 9, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Semi-Markov Offline Reinforcement Learning for Healthcare	Mar 17, 2022	Offline RLreinforcement-learning	CodeCode Available
Semi-Offline Reinforcement Learning for Optimized Text Generation	Jun 16, 2023	Offline RLreinforcement-learning	CodeCode Available
Uncovering Instabilities in Variational-Quantum Deep Q-Networks	Feb 10, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning	Sep 16, 2016	3D ReconstructionDeep Reinforcement Learning	CodeCode Available
Semi-supervised Deep Reinforcement Learning in Support of IoT and Smart City Services	Oct 9, 2018	Deep Reinforcement LearningIndoor Localization	CodeCode Available
On the Perturbed States for Transformed Input-robust Reinforcement Learning	Jul 31, 2024	DenoisingMuJoCo	CodeCode Available
Provable Defense against Backdoor Policies in Reinforcement Learning	Nov 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL	Feb 8, 2024	Computational EfficiencyReinforcement Learning (RL)	CodeCode Available
Understanding Adversarial Attacks on Observations in Deep Reinforcement Learning	Jun 30, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available
Model-Based Reinforcement Learning for Atari	Mar 1, 2019	Atari GamesAtari Games 100k	CodeCode Available
Metrics and continuity in reinforcement learning	Feb 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Efficient Meta Subspace Optimization	Oct 28, 2021	Reinforcement Learning (RL)	CodeCode Available
Mapping Language to Programs using Multiple Reward Components with Inverse Reinforcement Learning	Oct 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Towards Learning Transferable Conversational Skills using Multi-dimensional Dialogue Modelling	Mar 31, 2018	Dialogue ManagementDomain Adaptation	CodeCode Available
Sentence Simplification with Deep Reinforcement Learning	Mar 31, 2017	DecoderDeep Reinforcement Learning	CodeCode Available
Value-Free Policy Optimization via Reward Partitioning	Jun 16, 2025	Language ModelingLanguage Modelling	CodeCode Available
Meta Reinforcement Learning with Task Embedding and Shared Policy	May 16, 2019	Deep Reinforcement LearningMeta-Learning	CodeCode Available
Natural Question Generation with Reinforcement Learning Based Graph-to-Sequence Model	Oct 19, 2019	Graph Neural NetworkGraph-to-Sequence	CodeCode Available
On the Importance of Reward Design in Reinforcement Learning-based Dynamic Algorithm Configuration: A Case Study on OneMax with (1+(λ,λ))-GA	Feb 27, 2025	Reinforcement Learning (RL)	CodeCode Available
Task-Agnostic Dynamics Priors for Deep Reinforcement Learning	May 13, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Separating value functions across time-scales	Feb 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
xSRL: Safety-Aware Explainable Reinforcement Learning -- Safety as a Product of Explainability	Dec 26, 2024	Autonomous VehiclesReinforcement Learning (RL)	CodeCode Available
ProtoX: Explaining a Reinforcement Learning Agent via Prototyping	Nov 6, 2022	Contrastive LearningDeep Reinforcement Learning	CodeCode Available
SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient	Sep 18, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Sequence Adaptation via Reinforcement Learning in Recommender Systems	Jul 31, 2021	Recommendation Systemsreinforcement-learning	CodeCode Available
On the Implementation of a Reinforcement Learning-based Capacity Sharing Algorithm in O-RAN	Jul 21, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Understanding Curriculum Learning in Policy Optimization for Online Combinatorial Optimization	Feb 11, 2022	Combinatorial OptimizationReinforcement Learning (RL)	CodeCode Available
Sequence Modeling of Temporal Credit Assignment for Episodic Reinforcement Learning	May 31, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Cooperative Multi-Agent Reinforcement Learning with Hypergraph Convolution	Dec 9, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Towards Model-based Reinforcement Learning for Industry-near Environments	Jul 27, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
On the Generalization of Representations in Reinforcement Learning	Mar 1, 2022	Atari Gamesreinforcement-learning	CodeCode Available
Measuring Interventional Robustness in Reinforcement Learning	Sep 19, 2022	Fairnessreinforcement-learning	CodeCode Available
Zero-Shot Task Generalization with Multi-Task Deep Reinforcement Learning	Jun 15, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Understanding Game-Playing Agents with Natural Language Annotations	Apr 15, 2022	Imitation LearningReinforcement Learning (RL)	CodeCode Available
Model-Based Offline Reinforcement Learning with Pessimism-Modulated Dynamics Belief	Oct 13, 2022	D4RLOffline RL	CodeCode Available

Show:10 25 50

← PrevPage 276 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified