Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13351–13400 of 15113 papers

Title	Date	Tasks	Status
Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning	Nov 7, 2024	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Think Too Fast Nor Too Slow: The Computational Trade-off Between Planning And Reinforcement Learning	May 15, 2020	Decision MakingReinforcement Learning (RL)	CodeCode Available
Mixed-Initiative Level Design with RL Brush	Aug 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Third-Person Imitation Learning	Mar 6, 2017	Imitation Learningreinforcement-learning	CodeCode Available
Unsupervised Video Object Segmentation for Deep Reinforcement Learning	May 20, 2018	Atari GamesDecision Making	CodeCode Available
Solving Offline Reinforcement Learning with Decision Tree Regression	Jan 21, 2024	D4RLFeature Importance	CodeCode Available
SafeLife 1.0: Exploring Side Effects in Complex Environments	Dec 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control	Nov 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Refining Few-Step Text-to-Multiview Diffusion via Reinforcement Learning	May 26, 2025	Denoisingreinforcement-learning	CodeCode Available
XIRL: Cross-embodiment Inverse Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Reducing Overestimation Bias in Multi-Agent Domains Using Double Centralized Critics	Oct 3, 2019	Multi-agent Reinforcement LearningReinforcement Learning	CodeCode Available
Safe Model-based Reinforcement Learning with Stability Guarantees	May 23, 2017	modelModel-based Reinforcement Learning	CodeCode Available
Reinforcement Learning of Self Enhancing Camera Image and Signal Processing	Nov 15, 2021	BlockingData Augmentation	CodeCode Available
Recursive generalized type-2 fuzzy radial basis function neural networks for joint position estimation and adaptive EMG-based impedance control of lower limb exoskeletons	Feb 1, 2025	Electromyography (EMG)GPU	CodeCode Available
Unsupervised Visuomotor Control through Distributional Planning Networks	Feb 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
State Space Closure: Revisiting Endless Online Level Generation via Reinforcement Learning	Dec 6, 2022	Diversityreinforcement-learning	CodeCode Available
Safe Multi-Agent Navigation guided by Goal-Conditioned Safe Reinforcement Learning	Feb 25, 2025	BenchmarkingReinforcement Learning (RL)	CodeCode Available
MiWaves Reinforcement Learning Algorithm	Aug 27, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Parameter Space Noise for Exploration	Jun 6, 2017	continuous-controlContinuous Control	CodeCode Available
Recurrent Sum-Product-Max Networks for Decision Making in Perfectly-Observed Environments	Jun 12, 2020	Decision Makingreinforcement-learning	CodeCode Available
Recurrent Experience Replay in Distributed Reinforcement Learning	May 1, 2019	Atari Gamesreinforcement-learning	CodeCode Available
RecSim: A Configurable Simulation Platform for Recommender Systems	Sep 11, 2019	Interactive RecommendationRecommendation Systems	CodeCode Available
WaveCorr: Correlation-savvy Deep Reinforcement Learning for Portfolio Management	Sep 14, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available
Revisiting Parameter Sharing in Multi-Agent Deep Reinforcement Learning	May 27, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Unveiling the Compositional Ability Gap in Vision-Language Reasoning Model	May 26, 2025	DiagnosticReinforcement Learning (RL)	CodeCode Available
Noisy Zero-Shot Coordination: Breaking The Common Knowledge Assumption In Zero-Shot Coordination Games	Nov 7, 2024	Meta-LearningReinforcement Learning (RL)	CodeCode Available
Constrained Policy Improvement for Safe and Efficient Reinforcement Learning	May 20, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Safe Policy Optimization with Local Generalized Linear Function Approximations	Nov 9, 2021	Reinforcement Learning (RL)Safe Exploration	CodeCode Available
Modeling natural language emergence with integral transform theory and reinforcement learning	Nov 30, 2018	image-classificationImage Classification	CodeCode Available
WiNGPT-3.0 Technical Report	May 23, 2025	DiagnosticMedQA	CodeCode Available
Statistical Inference in Reinforcement Learning: A Selective Survey	Feb 22, 2025	reinforcement-learningReinforcement Learning	CodeCode Available
Statistical Inference of the Value Function for Reinforcement Learning in Infinite Horizon Settings	Jan 13, 2020	Decision Makingreinforcement-learning	CodeCode Available
Statistically Efficient Advantage Learning for Offline Reinforcement Learning in Infinite Horizons	Feb 26, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Noisy Networks for Exploration	Jun 30, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Tiered Reinforcement Learning: Pessimism in the Face of Uncertainty and Constant Regret	May 25, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research	Feb 26, 2018	continuous-controlContinuous Control	CodeCode Available
Recommender systems and reinforcement learning for human-building interaction and context-aware support: A text mining-driven review of scientific literature	Nov 13, 2024	ArticlesCollaborative Filtering	CodeCode Available
Parameterized Projected Bellman Operator	Dec 20, 2023	Decision MakingReinforcement Learning (RL)	CodeCode Available
Multi-Agent Trust Region Policy Optimization	Oct 15, 2020	Multi-agent Reinforcement LearningPrivacy Preserving	CodeCode Available
Multiagent Rollout Algorithms and Reinforcement Learning	Sep 30, 2019	Computational Efficiencyreinforcement-learning	CodeCode Available
Steady-State Error Compensation in Reference Tracking and Disturbance Rejection Problems for Reinforcement Learning-Based Control	Jan 31, 2022	Model Predictive ControlReinforcement Learning (RL)	CodeCode Available
Modeling Moral Choices in Social Dilemmas with Multi-Agent Reinforcement Learning	Jan 20, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Verifying Controllers Against Adversarial Examples with Bayesian Optimization	Feb 23, 2018	Bayesian Optimizationreinforcement-learning	CodeCode Available
Tight Regret Bounds for Model-Based Reinforcement Learning with Greedy Policies	May 27, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Multi-Agent Reinforcement Learning Resources Allocation Method Using Dueling Double Deep Q-Network in Vehicular Networks	May 12, 2023	Data InteractionMulti-agent Reinforcement Learning	CodeCode Available
Tilted Quantile Gradient Updates for Quantile-Constrained Reinforcement Learning	Dec 17, 2024	Formreinforcement-learning	CodeCode Available
Safe reinforcement learning for probabilistic reachability and safety specifications: A Lyapunov-based approach	Feb 24, 2020	Autonomous Drivingcontinuous-control	CodeCode Available
Multi-Agent Reinforcement Learning for Power Grid Topology Optimization	Oct 4, 2023	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Safe Reinforcement Learning From Pixels Using a Stochastic Latent Representation	Oct 2, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Modeling Explicit Concerning States for Reinforcement Learning in Visual Dialogue	Jul 12, 2021	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 268 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified