Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12801–12850 of 15113 papers

Title	Date	Tasks	Status
Which Model to Trust: Assessing the Influence of Models on the Performance of Reinforcement Learning Algorithms for Continuous Control Tasks	Oct 25, 2021	Benchmarkingcontinuous-control	CodeCode Available
Reinforcement Learning with State Observation Costs in Action-Contingent Noiselessly Observable Markov Decision Processes	Dec 1, 2021	Reinforcement Learning (RL)	CodeCode Available
MolOpt: Autonomous Molecular Geometry Optimization using Multi-Agent Reinforcement Learning	Aug 24, 2023	3D geometryComputational chemistry	CodeCode Available
Online Prototype Alignment for Few-shot Policy Transfer	Jun 12, 2023	Domain AdaptationReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning with Quantum Variational Circuits	Aug 15, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	CodeCode Available
Online Learning in Iterated Prisoner's Dilemma to Mimic Human Behavior	Jun 9, 2020	Multi-Armed Banditsreinforcement-learning	CodeCode Available
Tempo Adaptation in Non-stationary Reinforcement Learning	Sep 26, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Mean Actor Critic	Sep 1, 2017	Atari Gamesreinforcement-learning	CodeCode Available
Towards Practical Multi-Object Manipulation using Relational Reinforcement Learning	Dec 23, 2019	Objectreinforcement-learning	CodeCode Available
Temporal Alignment for History Representation in Reinforcement Learning	Apr 7, 2022	Atari Gamesreinforcement-learning	CodeCode Available
Temporal Shift Reinforcement Learning	Sep 5, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available
What Hides behind Unfairness? Exploring Dynamics Fairness in Reinforcement Learning	Apr 16, 2024	Attributecounterfactual	CodeCode Available
Visual Transfer between Atari Games using Competitive Reinforcement Learning	Sep 2, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Resolving Implicit Coordination in Multi-Agent Deep Reinforcement Learning with Deep Q-Networks & Game Theory	Dec 8, 2020	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Shrink-Perturb Improves Architecture Mixing during Population Based Training for Neural Architecture Search	Jul 28, 2023	Hyperparameter OptimizationImage Generation	CodeCode Available
Understanding when Dynamics-Invariant Data Augmentations Benefit Model-Free Reinforcement Learning Updates	Oct 26, 2023	Data Augmentationreinforcement-learning	CodeCode Available
Underwater Soft Fin Flapping Motion with Deep Neural Network Based Surrogate Model	Feb 5, 2025	Reinforcement Learning (RL)	CodeCode Available
Privacy-preserving Q-Learning with Functional Noise in Continuous State Spaces	Jan 30, 2019	Privacy PreservingQ-Learning	CodeCode Available
Natural Language Generation Using Reinforcement Learning with External Rewards	Nov 26, 2019	Decoderreinforcement-learning	CodeCode Available
Vanilla Gradient Descent for Oblique Decision Trees	Aug 17, 2024	Classificationregression	CodeCode Available
Temporal Difference Variational Auto-Encoder	Jun 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
TabNAS: Rejection Sampling for Neural Architecture Search on Tabular Datasets	Apr 15, 2022	Image RetrievalNeural Architecture Search	CodeCode Available
Towards Robust Deep Reinforcement Learning for Traffic Signal Control: Demand Surges, Incidents and Sensor Failures	Apr 17, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Privacy-Preserving Q-Learning with Functional Noise in Continuous Spaces	Dec 1, 2019	Privacy PreservingQ-Learning	CodeCode Available
Reinforcement Learning with Perturbed Rewards	Oct 2, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available
Model-Based Offline Planning with Trajectory Pruning	May 16, 2021	modelOffline RL	CodeCode Available
Prioritized Soft Q-Decomposition for Lexicographic Reinforcement Learning	Oct 3, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Sim2Rec: A Simulator-based Decision-making Approach to Optimize Real-World Long-term User Engagement in Sequential Recommender Systems	May 3, 2023	Decision MakingRecommendation Systems	CodeCode Available
Reinforcement Learning with Parameterized Actions	Sep 5, 2015	reinforcement-learningReinforcement Learning	CodeCode Available
Online Game Level Generation from Music	Jul 12, 2022	Game Designreinforcement-learning	CodeCode Available
Sim-Env: Decoupling OpenAI Gym Environments from Simulation Models	Feb 19, 2021	OpenAI Gymreinforcement-learning	CodeCode Available
Reinforcement Learning with Low-Complexity Liquid State Machines	Jun 4, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Visual Transfer for Reinforcement Learning via Wasserstein Domain Confusion	Jun 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Natural Environment Benchmarks for Reinforcement Learning	Nov 14, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness	Sep 29, 2023	Offline RLreinforcement-learning	CodeCode Available
Model-based Lifelong Reinforcement Learning with Bayesian Exploration	Oct 20, 2022	modelreinforcement-learning	CodeCode Available
Mapping Instructions and Visual Observations to Actions with Reinforcement Learning	Apr 28, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
HMM for Discovering Decision-Making Dynamics Using Reinforcement Learning Experiments	Jan 25, 2024	Decision Makingparameter estimation	CodeCode Available
Temporally-Extended ε-Greedy Exploration	Jun 2, 2020	Reinforcement Learning (RL)	CodeCode Available
SimpleDS: A Simple Deep Reinforcement Learning Dialogue System	Jan 18, 2016	Deep Reinforcement LearningFeature Engineering	CodeCode Available
Red Teaming with Mind Reading: White-Box Adversarial Policies Against RL Agents	Sep 5, 2022	Red Teamingreinforcement-learning	CodeCode Available
Simple Noisy Environment Augmentation for Reinforcement Learning	May 4, 2023	Data AugmentationDiversity	CodeCode Available
Reinforcement Learning with Euclidean Data Augmentation for State-Based Continuous Control	Oct 16, 2024	continuous-controlContinuous Control	CodeCode Available
Boosting Exploration in Multi-Task Reinforcement Learning using Adversarial Networks	Jan 27, 2022	Decision Makingreinforcement-learning	CodeCode Available
Rethinking Model-based, Policy-based, and Value-based Reinforcement Learning via the Lens of Representation Complexity	Dec 28, 2023	Reinforcement Learning (RL)	CodeCode Available
Simple random search of static linear policies is competitive for reinforcement learning	Dec 1, 2018	continuous-controlContinuous Control	CodeCode Available
Rethinking Out-of-Distribution Detection for Reinforcement Learning: Advancing Methods for Evaluation and Detection	Apr 10, 2024	Out-of-Distribution DetectionOut of Distribution (OOD) Detection	CodeCode Available
Principled Exploration via Optimistic Bootstrapping and Backward Induction	May 13, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
simple_rl: Reproducible Reinforcement Learning in Python	Mar 6, 2019	Philosophyreinforcement-learning	CodeCode Available
Pre-training with Non-expert Human Demonstration for Deep Reinforcement Learning	Dec 21, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 257 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified