Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 15113 papers

Title	Date	Tasks	Status	Hype
Cross-Domain Policy Adaptation by Capturing Representation Mismatch	May 24, 2024	Reinforcement Learning (RL)Representation Learning	CodeCode Available	1
Cross-Embodiment Robot Manipulation Skill Transfer using Latent Space Alignment	Jun 4, 2024	DecoderReinforcement Learning (RL)	CodeCode Available	1
Contextualized Rewriting for Text Summarization	Jan 31, 2021	Extractive Summarizationreinforcement-learning	CodeCode Available	1
Context-aware Dynamics Model for Generalization in Model-Based Reinforcement Learning	May 14, 2020	modelModel-based Reinforcement Learning	CodeCode Available	1
Ctrl-DNA: Controllable Cell-Type-Specific Regulatory DNA Design via Constrained RL	May 26, 2025	Reinforcement Learning (RL)Specificity	CodeCode Available	1
Affordance Learning from Play for Sample-Efficient Policy Learning	Mar 1, 2022	Deep Reinforcement LearningMotion Planning	CodeCode Available	1
Accelerating Quadratic Optimization with Reinforcement Learning	Jul 22, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Curious Hierarchical Actor-Critic Reinforcement Learning	May 7, 2020	BenchmarkingHierarchical Reinforcement Learning	CodeCode Available	1
Actor-Attention-Critic for Multi-Agent Reinforcement Learning	Oct 5, 2018	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
CURL: Contrastive Unsupervised Representations for Reinforcement Learning	Apr 8, 2020	Atari GamesAtari Games 100k	CodeCode Available	1
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1
Curriculum Reinforcement Learning using Optimal Transport via Gradual Domain Adaptation	Oct 18, 2022	Domain Adaptationreinforcement-learning	CodeCode Available	1
Contextualize Me -- The Case for Context in Reinforcement Learning	Feb 9, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Distributed Multi-Agent Reinforcement Learning with One-hop Neighbors and Compute Straggler Mitigation	Feb 18, 2022	Distributed ComputingMulti-agent Reinforcement Learning	CodeCode Available	1
Data-Efficient Reinforcement Learning with Self-Predictive Representations	Jul 12, 2020	Atari Games 100kData Augmentation	CodeCode Available	1
DataLight: Offline Data-Driven Traffic Signal Control	Mar 20, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Contention Window Optimization in IEEE 802.11ax Networks with Deep Reinforcement Learning	Mar 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Content Masked Loss: Human-Like Brush Stroke Planning in a Reinforcement Learning Painting Agent	Dec 18, 2020	object-detectionObject Detection	CodeCode Available	1
Contingency-Aware Influence Maximization: A Reinforcement Learning Approach	Jun 13, 2021	Combinatorial Optimizationreinforcement-learning	CodeCode Available	1
Continuous Coordination As a Realistic Scenario for Lifelong Learning	Mar 4, 2021	Continual LearningDeep Reinforcement Learning	CodeCode Available	1
Decision Transformer: Reinforcement Learning via Sequence Modeling	Jun 2, 2021	Atari GamesD4RL	CodeCode Available	1
Decomposed Mutual Information Optimization for Generalized Context in Meta-Reinforcement Learning	Oct 9, 2022	Decision MakingMeta Reinforcement Learning	CodeCode Available	1
Decoupling Strategy and Generation in Negotiation Dialogues	Aug 29, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1
Decoupling Value and Policy for Generalization in Reinforcement Learning	Feb 20, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Actor-Critic Learning for Distributed Power Control in Wireless Mobile Networks	Sep 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Accelerating Reinforcement Learning with Learned Skill Priors	Oct 22, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Deep Intrinsically Motivated Exploration in Continuous Control	Oct 1, 2022	continuous-controlContinuous Control	CodeCode Available	1
Control-Oriented Model-Based Reinforcement Learning with Implicit Differentiation	Jun 6, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Latent Competition: Learning to Race Using Visual Control Policies in Latent Space	Feb 19, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Actor-Critic Reinforcement Learning for Control with Stability Guarantee	Apr 29, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
A game-theoretic analysis of networked system control for common-pool resource management using multi-agent reinforcement learning	Oct 15, 2020	ManagementMulti-agent Reinforcement Learning	CodeCode Available	1
A Game-Theoretic Approach to Multi-Agent Trust Region Optimization	Jun 12, 2021	Atari GamesMuJoCo	CodeCode Available	1
DeepMind Lab2D	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning based Recommendation with Explicit User-Item Interactions Modeling	Oct 29, 2018	Collaborative FilteringDecision Making	CodeCode Available	1
Deep Reinforcement Learning based Evasion Generative Adversarial Network for Botnet Detection	Oct 6, 2022	Deep Reinforcement LearningGenerative Adversarial Network	CodeCode Available	1
Deep-Reinforcement-Learning-based Path Planning for Industrial Robots using Distance Sensors as Observation	Jan 14, 2023	Deep Reinforcement LearningIndustrial Robots	CodeCode Available	1
Deep Reinforcement Learning Control of Quantum Cartpoles	Oct 21, 2019	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 1, 2023	Deep Reinforcement LearningEdge-computing	CodeCode Available	1
Deep Reinforcement Learning for Active Human Pose Estimation	Jan 7, 2020	3D Human Pose EstimationDeep Reinforcement Learning	CodeCode Available	1
A General Contextualized Rewriting Framework for Text Summarization	Jul 13, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Comparing Deep Reinforcement Learning Algorithms in Two-Echelon Supply Chains	Apr 20, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity	Feb 14, 2019	continuous-controlContinuous Control	CodeCode Available	1
Deep Reinforcement Learning for Entity Alignment	Mar 7, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Deep reinforcement learning for large-scale epidemic control	Mar 30, 2020	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for List-wise Recommendations	Dec 30, 2017	Deep Reinforcement LearningRecommendation Systems	CodeCode Available	1
Accelerating Robot Learning of Contact-Rich Manipulations: A Curriculum Learning Study	Apr 27, 2022	Contact-rich ManipulationReinforcement Learning (RL)	CodeCode Available	1
Deep Reinforcement Learning for Process Synthesis	Sep 23, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Reinforcement learning for real autonomous mobile robot navigation in indoor environments	May 28, 2020	continuous-controlContinuous Control	CodeCode Available	1
Accelerating lifelong reinforcement learning via reshaping rewards	Oct 17, 2021	Lifelong learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 15 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified