Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6376–6400 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning Your Way: Agent Characterization through Policy Regularization	Jan 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Personalized Drug Discovery and Design for Complex Diseases: A Systems Pharmacology Perspective	Jan 21, 2022	Drug DesignDrug Discovery	—Unverified	0
Occupancy Information Ratio: Infinite-Horizon, Information-Directed, Parameterized Policy Search	Jan 21, 2022	Multi-Armed BanditsReinforcement Learning (RL)	—Unverified	0
Tensor and Matrix Low-Rank Value-Function Approximation in Reinforcement Learning	Jan 21, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Environment Generation for Zero-Shot Compositional Reinforcement Learning	Jan 21, 2022	Deep Reinforcement LearningNavigate	—Unverified	0
Deep Reinforcement Learning with Spiking Q-learning	Jan 21, 2022	Atari GamesDeep Reinforcement Learning	—Unverified	0
Deep reinforcement learning under signal temporal logic constraints using Lagrangian relaxation	Jan 21, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Instance-Dependent Confidence and Early Stopping for Reinforcement Learning	Jan 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Two-Step Hybrid Policy for Graph-Based Interpretable Reinforcement Learning	Jan 21, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
DROPO: Sim-to-Real Transfer with Offline Domain Randomization	Jan 20, 2022	Reinforcement Learning (RL)	CodeCode Available	1
A Prescriptive Dirichlet Power Allocation Policy with Deep Reinforcement Learning	Jan 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Goal-Conditioned Reinforcement Learning: Problems and Solutions	Jan 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Self-Awareness Safety of Deep Reinforcement Learning in Road Traffic Junction Driving	Jan 20, 2022	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Addressing Maximization Bias in Reinforcement Learning with Two-Sample Testing	Jan 20, 2022	Q-Learningreinforcement-learning	CodeCode Available	1
Safety-Aware Multi-Agent Apprenticeship Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Recursive Constraints to Prevent Instability in Constrained Reinforcement Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Multi-agent Skills for Tabular Reinforcement Learning using Factor Graphs	Jan 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Sim-to-Lab-to-Real: Safe Reinforcement Learning with Shielding and Generalization Guarantees	Jan 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Priors, Hierarchy, and Information Asymmetry for Skill Transfer in Reinforcement Learning	Jan 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Online POI Recommendation: Learning Dynamic Geo-Human Interactions in Streams	Jan 19, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning Textbook	Jan 19, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	2
Look Closer: Bridging Egocentric and Third-Person Views with Transformers for Robotic Manipulation	Jan 19, 2022	Reinforcement Learning (RL)	—Unverified	0
Anytime PSRO for Two-Player Zero-Sum Games	Jan 19, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected and Automated Vehicles at Signalized Intersections	Jan 19, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Conservative Distributional Reinforcement Learning with Safety Constraints	Jan 18, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 256 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified