Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14151–14200 of 15113 papers

Title	Date	Tasks	Status
Deep reinforcement learning for irrigation scheduling using high-dimensional sensor feedback	Jan 2, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reward Shaping for Human Learning via Inverse Reinforcement Learning	Feb 25, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
AI Safety Gridworlds	Nov 27, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem	Feb 5, 2024	Montezuma's RevengeNetHack	CodeCode Available
An Optical Control Environment for Benchmarking Reinforcement Learning Algorithms	Mar 23, 2022	BenchmarkingDeep Reinforcement Learning	CodeCode Available
Interestingness Elements for Explainable Reinforcement Learning: Understanding Agents' Capabilities and Limitations	Dec 19, 2019	Diversityreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Industrial Insertion Tasks with Visual Inputs and Natural Rewards	Jun 13, 2019	Deep Reinforcement LearningFriction	CodeCode Available
Diversity Actor-Critic: Sample-Aware Entropy Regularization for Sample-Efficient Exploration	Jun 2, 2020	DiversityEfficient Exploration	CodeCode Available
An Open-source Sim2Real Approach for Sensor-independent Robot Navigation in a Grid	Nov 5, 2024	Autonomous NavigationReinforcement Learning (RL)	CodeCode Available
Diversity-based Deep Reinforcement Learning Towards Multidimensional Difficulty for Fighting Game AI	Nov 4, 2022	Deep Reinforcement LearningDiversity	CodeCode Available
LatentPoison - Adversarial Attacks On The Latent Space	Nov 8, 2017	DecoderGeneral Classification	CodeCode Available
Diversity-Driven Extensible Hierarchical Reinforcement Learning	Nov 10, 2018	DiversityHierarchical Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Imbalanced Classification	Jan 5, 2019	ClassificationDecision Making	CodeCode Available
A Nonparametric Off-Policy Policy Gradient	Jan 8, 2020	Density EstimationPolicy Gradient Methods	CodeCode Available
Human-guided Robot Behavior Learning: A GAN-assisted Preference-based Reinforcement Learning Approach	Oct 15, 2020	Generative Adversarial NetworkMuJoCo	CodeCode Available
Human-Inspired Framework to Accelerate Reinforcement Learning	Feb 28, 2023	Decision Makingreinforcement-learning	CodeCode Available
Auto.gov: Learning-based Governance for Decentralized Finance (DeFi)	Feb 19, 2023	Reinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning with Modulated Hebbian plus Q Network Architecture	Sep 21, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Divide-and-Conquer Reinforcement Learning	Nov 27, 2017	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Leveraging exploration in off-policy algorithms via normalizing flows	May 16, 2019	continuous-controlContinuous Control	CodeCode Available
Hierarchical Reinforcement Learning with AI Planning Models	Mar 1, 2022	Decision MakingHierarchical Reinforcement Learning	CodeCode Available
Latent Safety-Constrained Policy Approach for Safe Offline Reinforcement Learning	Dec 11, 2024	Autonomous DrivingOffline RL	CodeCode Available
DL2: A Deep Learning-driven Scheduler for Deep Learning Clusters	Sep 13, 2019	Deep LearningFairness	CodeCode Available
ACRE: Actor-Critic with Reward-Preserving Exploration	Aug 14, 2023	continuous-controlContinuous Control	CodeCode Available
DM^2: Decentralized Multi-Agent Reinforcement Learning for Distribution Matching	Jun 1, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Adaptive Combination of a Genetic Algorithm and Novelty Search for Deep Neuroevolution	Sep 8, 2022	DiversityReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning for General Video Game AI	Jun 6, 2018	Atari GamesBenchmarking	CodeCode Available
Deep reinforcement learning for feedback control in a collective flashing ratchet	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Event-Driven Multi-Agent Decision Processes	Sep 19, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Human level control through deep reinforcement learning	Feb 25, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available
DNS: Determinantal Point Process Based Neural Network Sampler for Ensemble Reinforcement Learning	Jan 31, 2022	continuous-controlContinuous Control	CodeCode Available
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning	May 27, 2019	Q-Learningreinforcement-learning	CodeCode Available
AutoGMap: Learning to Map Large-scale Sparse Graphs on Memristive Crossbars	Nov 15, 2021	CPUDecision Making	CodeCode Available
Human-Level Control without Server-Grade Hardware	Nov 1, 2021	Cloud ComputingCPU	CodeCode Available
A Non-Monolithic Policy Approach of Offline-to-Online Reinforcement Learning	Oct 31, 2024	Reinforcement Learning (RL)	CodeCode Available
A Hybrid Stochastic Policy Gradient Algorithm for Reinforcement Learning	Mar 1, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Event-Triggered Control	Sep 13, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement Learning	Jul 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Do deep reinforcement learning agents model intentions?	May 15, 2018	Deep Reinforcement Learningmodel	CodeCode Available
Collision Avoidance Robotics Via Meta-Learning (CARML)	Jul 16, 2020	Collision AvoidanceMeta-Learning	CodeCode Available
Deep Reinforcement Learning for Efficient Measurement of Quantum Devices	Sep 30, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
Collision Avoidance in Pedestrian-Rich Environments with Deep Reinforcement Learning	Oct 24, 2019	Collision AvoidanceDecision Making	CodeCode Available
A Hybrid Framework for Reinsurance Optimization: Integrating Generative Models and Reinforcement Learning	Jan 11, 2025	Computational Efficiencyreinforcement-learning	CodeCode Available
Does Self-supervised Learning Really Improve Reinforcement Learning from Pixels?	Jun 10, 2022	Image Augmentationreinforcement-learning	CodeCode Available
Collaborative Evolutionary Reinforcement Learning	May 2, 2019	continuous-controlContinuous Control	CodeCode Available
Does the Adam Optimizer Exacerbate Catastrophic Forgetting?	Feb 15, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning for Dialogue Generation	Jun 5, 2016	ChatbotDeep Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning for De-Novo Drug Design	Nov 29, 2017	Deep Reinforcement LearningDrug Design	CodeCode Available
Collaborative Deep Reinforcement Learning	Feb 19, 2017	Deep Reinforcement LearningKnowledge Distillation	CodeCode Available
Adaptive Auxiliary Task Weighting for Reinforcement Learning	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 284 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified