Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14101–14150 of 15113 papers

Title	Date	Tasks	Status
Accept Synthetic Objects as Real: End-to-End Training of Attentive Deep Visuomotor Policies for Manipulation in Clutter	Sep 24, 2019	Data AugmentationImitation Learning	CodeCode Available
Distributed-Training-and-Execution Multi-Agent Reinforcement Learning for Power Control in HetNet	Dec 15, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Distributed Transmission Control for Wireless Networks using Multi-Agent Reinforcement Learning	May 13, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations	Jan 7, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Automated Discovery of Local Rules for Desired Collective-Level Behavior Through Reinforcement Learning	Jul 25, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
How to Build User Simulators to Train RL-based Dialog Systems	Sep 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Learning to Execute: Efficient Learning of Universal Plan-Conditioned Policies in Robotics	Nov 15, 2021	Learning to ExecuteReinforcement Learning (RL)	CodeCode Available
Distributional constrained reinforcement learning for supply chain optimization	Feb 3, 2023	Distributional Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Towards Abstractive Timeline Summarisation using Preference-based Reinforcement Learning	Nov 14, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
AIXIjs: A Software Demo for General Reinforcement Learning	May 22, 2017	General Reinforcement LearningOpenAI Gym	CodeCode Available
A Novel Approach to Curiosity and Explainable Reinforcement Learning via Interpretable Sub-Goals	Apr 14, 2021	Generative Adversarial Networkreinforcement-learning	CodeCode Available
A Deep Multi-Agent Reinforcement Learning Approach to Autonomous Separation Assurance	Mar 17, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Financial Trading as a Game: A Deep Reinforcement Learning Approach	Jul 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
How to Make Deep RL Work in Practice	Oct 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Distributionally Robust Off-Dynamics Reinforcement Learning: Provable Efficiency with Linear Function Approximation	Feb 23, 2024	Reinforcement Learning (RL)	CodeCode Available
Leveraging class abstraction for commonsense reinforcement learning via residual policy gradient methods	Jan 28, 2022	Knowledge GraphsPolicy Gradient Methods	CodeCode Available
How to pick the domain randomization parameters for sim-to-real transfer of reinforcement learning policies?	Mar 28, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Competing for pixels: a self-play algorithm for weakly-supervised segmentation	May 26, 2024	Binary ClassificationImage Segmentation	CodeCode Available
How to Sense the World: Leveraging Hierarchy in Multimodal Perception for Robust Reinforcement Learning Agents	Oct 7, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Comparison of Reinforcement Learning algorithms applied to the Cart Pole problem	Oct 3, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Interactive Query-Assisted Summarization via Deep Reinforcement Learning	Jul 1, 2022	Deep Reinforcement LearningInformativeness	CodeCode Available
Distributional Reinforcement Learning for Energy-Based Sequential Models	Dec 18, 2019	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Multimodal Transition Dynamics for Model-Based Reinforcement Learning	May 1, 2017	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Multi-Objective Curricula for Robotic Policy Learning	Oct 6, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Distributional Reinforcement Learning for Multi-Dimensional Reward Functions	Oct 26, 2021	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
A Deeper Look at Experience Replay	Dec 4, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Distributional Reinforcement Learning with Regularized Wasserstein Loss	Feb 1, 2022	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Learning Multiresolution Matrix Factorization and its Wavelet Networks on Graphs	Nov 2, 2021	Reinforcement Learning (RL)	CodeCode Available
Distributional Reinforcement Learning with Quantile Regression	Oct 27, 2017	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Leveraging Demonstrations for Deep Reinforcement Learning on Robotics Problems with Sparse Rewards	Jul 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Multi-Domain Dialogue Systems	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Multi-class Imbalanced Training	May 24, 2022	Deep Reinforcement Learningimbalanced classification	CodeCode Available
AC-Teach: A Bayesian Actor-Critic Method for Policy Learning with an Ensemble of Suboptimal Teachers	Sep 9, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
HRL4IN: Hierarchical Reinforcement Learning for Interactive Navigation with Mobile Manipulators	Oct 24, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Comparison of Model-Free and Model-Based Learning-Informed Planning for PointGoal Navigation	Dec 17, 2022	Deep Reinforcement Learningmodel	CodeCode Available
Learning Natural Language Generation with Truncated Reinforcement Learning	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available
Distributional Reward Estimation for Effective Multi-Agent Deep Reinforcement Learning	Oct 14, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
HTMRL: Biologically Plausible Reinforcement Learning with Hierarchical Temporal Memory	Sep 18, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Automated Curriculum Learning by Rewarding Temporally Rare Events	Mar 19, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Interactive Semantic Parsing for If-Then Recipes via Hierarchical Reinforcement Learning	Aug 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
A Critical Investigation of Deep Reinforcement Learning for Navigation	Feb 7, 2018	Deep Reinforcement LearningNavigate	CodeCode Available
Combining Reinforcement Learning and Optimal Transport for the Traveling Salesman Problem	Mar 2, 2022	Combinatorial OptimizationDeep Learning	CodeCode Available
DistSPECTRL: Distributing Specifications in Multi-Agent Reinforcement Learning Systems	Jun 28, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Latent Guided Sampling for Combinatorial Optimization	Jun 4, 2025	Combinatorial OptimizationDrug Discovery	CodeCode Available
Deep Reinforcement Learning for Mention-Ranking Coreference Models	Sep 27, 2016	coreference-resolutionCoreference Resolution	CodeCode Available
Combining Automated Optimisation of Hyperparameters and Reward Shape	Jun 26, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Automata Learning meets Shielding	Dec 4, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available
Combined Reinforcement Learning via Abstract Representations	Sep 12, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Latent Intention Dialogue Models	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Learning Diverse Options via InfoMax Termination Critic	Oct 6, 2020	Continuous ControlDiversity	CodeCode Available

Show:10 25 50

← PrevPage 283 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified