Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14451–14500 of 15113 papers

Title	Date	Tasks	Status
Decomposing Elements of Problem Solving: What "Math" Does RL Teach?	May 28, 2025	MathMathematical Problem-Solving	CodeCode Available
Centralized Model and Exploration Policy for Multi-Agent RL	Jul 14, 2021	Reinforcement Learning (RL)	CodeCode Available
Inverse reinforcement learning for video games	Oct 24, 2018	continuous-controlContinuous Control	CodeCode Available
Decomposing Control Lyapunov Functions for Efficient Reinforcement Learning	Mar 18, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
A Survey of Deep Network Solutions for Learning Control in Robotics: From Reinforcement to Imitation	Dec 21, 2016	Deep Reinforcement LearningImitation Learning	CodeCode Available
Leveraging Sequentiality in Reinforcement Learning from a Single Demonstration	Nov 9, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available
Efficient and Scalable Deep Reinforcement Learning for Mean Field Control Games	Dec 28, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Efficient Architecture Search by Network Transformation	Jul 16, 2017	Image ClassificationNeural Architecture Search	CodeCode Available
CEM-GD: Cross-Entropy Method with Gradient Descent Planner for Model-Based Reinforcement Learning	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available
Gap-Dependent Unsupervised Exploration for Reinforcement Learning	Aug 11, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Learning RL-Policies for Joint Beamforming Without Exploration: A Batch Constrained Off-Policy Approach	Oct 12, 2023	Deep Reinforcement LearningQ-Learning	CodeCode Available
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning	Feb 12, 2018	Efficient Explorationreinforcement-learning	CodeCode Available
Efficient bimanual handover and rearrangement via symmetry-aware actor-critic learning	Apr 7, 2023	Reinforcement Learning (RL)	CodeCode Available
CEIP: Combining Explicit and Implicit Priors for Reinforcement Learning with Demonstrations	Oct 18, 2022	Formreinforcement-learning	CodeCode Available
Accelerated Policy Gradient: On the Convergence Rates of the Nesterov Momentum for Reinforcement Learning	Oct 18, 2023	Policy Gradient Methodsreinforcement-learning	CodeCode Available
Efficient Communication in Multi-Agent Reinforcement Learning via Variance Based Control	Sep 6, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Gaussian Processes for Data-Efficient Learning in Robotics and Control	Feb 10, 2015	Gaussian ProcessesReinforcement Learning	CodeCode Available
Inverse Reinforcement Learning in Contextual MDPs	May 23, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available
DeCOM: Decomposed Policy for Constrained Cooperative Multi-Agent Reinforcement Learning	Nov 10, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Causal State Distillation for Explainable Reinforcement Learning	Dec 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
A Study on Overfitting in Deep Reinforcement Learning	Apr 18, 2018	Deep Reinforcement LearningInductive Bias	CodeCode Available
Efficient Decoupled Neural Architecture Search by Structure and Operation Sampling	Oct 23, 2019	Neural Architecture Searchreinforcement-learning	CodeCode Available
Efficient Deep Reinforcement Learning via Adaptive Policy Transfer	Feb 19, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Efficient Deep Reinforcement Learning with Predictive Processing Proximal Policy Optimization	Nov 11, 2022	Atari GamesDeep Reinforcement Learning	CodeCode Available
Efficient Dialog Policy Learning via Positive Memory Retention	Oct 2, 2018	Goal-Oriented DialogObject Discovery	CodeCode Available
Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL	Jun 8, 2024	Data AugmentationMamba	CodeCode Available
A Study of Reinforcement Learning for Neural Machine Translation	Aug 27, 2018	Machine TranslationNMT	CodeCode Available
A Connection between Generative Adversarial Networks, Inverse Reinforcement Learning, and Energy-Based Models	Nov 11, 2016	Imitation Learningreinforcement-learning	CodeCode Available
Causal Reasoning from Meta-reinforcement Learning	Jan 23, 2019	counterfactualMeta Reinforcement Learning	CodeCode Available
Inter-Level Cooperation in Hierarchical Reinforcement Learning	Dec 5, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Imitation Learning by Reinforcement Learning	Aug 10, 2021	continuous-controlContinuous Control	CodeCode Available
Active exploration in parameterized reinforcement learning	Oct 6, 2016	Meta-LearningQ-Learning	CodeCode Available
Imitation Learning for Sentence Generation with Dilated Convolutions Using Adversarial Training	Aug 15, 2019	DiversityGenerative Adversarial Network	CodeCode Available
A Study of Plasticity Loss in On-Policy Deep Reinforcement Learning	May 29, 2024	Continual LearningDeep Reinforcement Learning	CodeCode Available
Generalised Discount Functions applied to a Monte-Carlo AImu Implementation	Mar 3, 2017	General Reinforcement Learningreinforcement-learning	CodeCode Available
Agent-Time Attention for Sparse Rewards Multi-Agent Reinforcement Learning	Oct 31, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Causal Campbell-Goodhart's law and Reinforcement Learning	Nov 2, 2020	Causal InferenceDecision Making	CodeCode Available
Model-based Reinforcement Learning for Continuous Control with Posterior Sampling	Nov 20, 2020	continuous-controlContinuous Control	CodeCode Available
Learning When to Treat Business Processes: Prescriptive Process Monitoring with Causal Inference and Reinforcement Learning	Mar 7, 2023	Causal InferenceConformal Prediction	CodeCode Available
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available
Generalizable Resource Allocation in Stream Processing via Deep Reinforcement Learning	Nov 19, 2019	DecoderDeep Reinforcement Learning	CodeCode Available
Case-Based Inverse Reinforcement Learning Using Temporal Coherence	Jun 12, 2022	Imitation Learningreinforcement-learning	CodeCode Available
Efficient Exploration through Bayesian Deep Q-Networks	Feb 13, 2018	Atari GamesEfficient Exploration	CodeCode Available
Cascaded LSTMs based Deep Reinforcement Learning for Goal-driven Dialogue	Oct 31, 2019	Deep Reinforcement LearningDialogue Management	CodeCode Available
Generalization and Exploration via Randomized Value Functions	Feb 4, 2014	Efficient Explorationreinforcement-learning	CodeCode Available
Generalization and Regularization in DQN	Sep 29, 2018	Atari GamesBenchmarking	CodeCode Available
Decision-Aware Actor-Critic with Function Approximation and Theoretical Guarantees	May 24, 2023	Reinforcement Learning (RL)	CodeCode Available
Learning Robust Reward Machines from Noisy Labels	Aug 27, 2024	Inductive logic programmingReinforcement Learning (RL)	CodeCode Available
Adaptive ROI Generation for Video Object Segmentation Using Reinforcement Learning	Sep 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 290 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified