Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6351–6400 of 15113 papers

Title	Date	Tasks	Status	Hype
Modeling Human Exploration Through Resource-Rational Reinforcement Learning	Jan 27, 2022	Meta-Learningreinforcement-learning	CodeCode Available	0
Human-centered mechanism design with Democratic AI	Jan 27, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Generative Adversarial Exploration for Reinforcement Learning	Jan 27, 2022	Generative Adversarial NetworkMontezuma's Revenge	—Unverified	0
Reinforcement Learning-Empowered Mobile Edge Computing for 6G Edge Intelligence	Jan 27, 2022	Edge-computingreinforcement-learning	—Unverified	0
Quantile-Based Policy Optimization for Reinforcement Learning	Jan 27, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Reinforcement Learning for Network Load Balancing in Data Center	Jan 27, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Invariable Semantical Representation from Language for Extensible Policy Generalization	Jan 26, 2022	Reinforcement Learning (RL)	—Unverified	0
moolib: A Platform for Distributed RL	Jan 26, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	2
Probe-Based Interventions for Modifying Agent Behavior	Jan 26, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Reward-Free RL is No Harder Than Reward-Aware RL in Linear Markov Decision Processes	Jan 26, 2022	Reinforcement Learning (RL)	—Unverified	0
Exploiting Semantic Epsilon Greedy Exploration Strategy in Multi-Agent Reinforcement Learning	Jan 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Hyperparameter Tuning for Deep Reinforcement Learning Applications	Jan 26, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Using Deep Reinforcement Learning for Zero Defect Smart Forging	Jan 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Based Query Vertex Ordering Model for Subgraph Matching	Jan 25, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
MOORe: Model-based Offline-to-Online Reinforcement Learning	Jan 25, 2022	D4RLmodel	—Unverified	0
The Paradox of Choice: Using Attention in Hierarchical Reinforcement Learning	Jan 24, 2022	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	1
Pearl: Parallel Evolutionary and Reinforcement Learning Library	Jan 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Generative Planning for Temporally Coordinated Exploration in Reinforcement Learning	Jan 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
Accelerated Intravascular Ultrasound Imaging using Deep Reinforcement Learning	Jan 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Constrained Policy Optimization via Bayesian World Models	Jan 24, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Large-Scale Graph Reinforcement Learning in Wireless Control Systems	Jan 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
State-Conditioned Adversarial Subgoal Generation	Jan 24, 2022	continuous-controlContinuous Control	—Unverified	0
Understanding the Effects of Second-Order Approximations in Natural Policy Gradient Reinforcement Learning	Jan 22, 2022	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0
Online Attentive Kernel-Based Temporal Difference Learning	Jan 22, 2022	AcrobotReinforcement Learning (RL)	—Unverified	0
Multi-Agent Adversarial Attacks for Multi-Channel Communications	Jan 22, 2022	channel selectionReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning Your Way: Agent Characterization through Policy Regularization	Jan 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Personalized Drug Discovery and Design for Complex Diseases: A Systems Pharmacology Perspective	Jan 21, 2022	Drug DesignDrug Discovery	—Unverified	0
Occupancy Information Ratio: Infinite-Horizon, Information-Directed, Parameterized Policy Search	Jan 21, 2022	Multi-Armed BanditsReinforcement Learning (RL)	—Unverified	0
Tensor and Matrix Low-Rank Value-Function Approximation in Reinforcement Learning	Jan 21, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Environment Generation for Zero-Shot Compositional Reinforcement Learning	Jan 21, 2022	Deep Reinforcement LearningNavigate	—Unverified	0
Deep Reinforcement Learning with Spiking Q-learning	Jan 21, 2022	Atari GamesDeep Reinforcement Learning	—Unverified	0
Deep reinforcement learning under signal temporal logic constraints using Lagrangian relaxation	Jan 21, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Instance-Dependent Confidence and Early Stopping for Reinforcement Learning	Jan 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Two-Step Hybrid Policy for Graph-Based Interpretable Reinforcement Learning	Jan 21, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
DROPO: Sim-to-Real Transfer with Offline Domain Randomization	Jan 20, 2022	Reinforcement Learning (RL)	CodeCode Available	1
A Prescriptive Dirichlet Power Allocation Policy with Deep Reinforcement Learning	Jan 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Goal-Conditioned Reinforcement Learning: Problems and Solutions	Jan 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Self-Awareness Safety of Deep Reinforcement Learning in Road Traffic Junction Driving	Jan 20, 2022	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Addressing Maximization Bias in Reinforcement Learning with Two-Sample Testing	Jan 20, 2022	Q-Learningreinforcement-learning	CodeCode Available	1
Safety-Aware Multi-Agent Apprenticeship Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Recursive Constraints to Prevent Instability in Constrained Reinforcement Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Multi-agent Skills for Tabular Reinforcement Learning using Factor Graphs	Jan 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Sim-to-Lab-to-Real: Safe Reinforcement Learning with Shielding and Generalization Guarantees	Jan 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Priors, Hierarchy, and Information Asymmetry for Skill Transfer in Reinforcement Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Online POI Recommendation: Learning Dynamic Geo-Human Interactions in Streams	Jan 19, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning Textbook	Jan 19, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	2
Look Closer: Bridging Egocentric and Third-Person Views with Transformers for Robotic Manipulation	Jan 19, 2022	Reinforcement Learning (RL)	—Unverified	0
Anytime PSRO for Two-Player Zero-Sum Games	Jan 19, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected and Automated Vehicles at Signalized Intersections	Jan 19, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Conservative Distributional Reinforcement Learning with Safety Constraints	Jan 18, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 128 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified