Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7901–7925 of 15113 papers

Title	Date	Tasks	Status	Hype
Branch Prediction as a Reinforcement Learning Problem: Why, How and Case Studies	Jun 25, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Control of a Mixed Autonomy Signalised Urban Intersection: An Action-Delayed Reinforcement Learning Approach	Jun 24, 2021	Reinforcement Learning (RL)	—Unverified	0
Brax -- A Differentiable Physics Engine for Large Scale Rigid Body Simulation	Jun 24, 2021	MuJoCoOpenAI Gym	CodeCode Available	2
Density Constrained Reinforcement Learning	Jun 24, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Model-Based Reinforcement Learning via Latent-Space Collocation	Jun 24, 2021	modelModel-based Reinforcement Learning	CodeCode Available	1
Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy Evaluation	Jun 24, 2021	Meta Reinforcement LearningOff-policy evaluation	CodeCode Available	1
Hierarchically Integrated Models: Learning to Navigate from Heterogeneous Robots	Jun 24, 2021	Deep Reinforcement LearningNavigate	—Unverified	0
The Option Keyboard: Combining Skills in Reinforcement Learning	Jun 24, 2021	Managementreinforcement-learning	—Unverified	0
Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit Argument Relations	Jun 23, 2021	Event ExtractionIncremental Learning	CodeCode Available	1
Evolving Hierarchical Memory-Prediction Machines in Multi-Task Reinforcement Learning	Jun 23, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Bregman Gradient Policy Optimization	Jun 23, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Uncertainty-Aware Model-Based Reinforcement Learning with Application to Autonomous Driving	Jun 23, 2021	Autonomous DrivingModel-based Reinforcement Learning	—Unverified	0
Provably Efficient Representation Selection in Low-rank Markov Decision Processes: From Online to Offline RL	Jun 22, 2021	Deep Reinforcement LearningOffline RL	—Unverified	0
Uniform-PAC Bounds for Reinforcement Learning with Linear Function Approximation	Jun 22, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Local policy search with Bayesian optimization	Jun 22, 2021	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1
Off-Policy Reinforcement Learning with Delayed Rewards	Jun 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2021	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Variance-Aware Off-Policy Evaluation with Linear Function Approximation	Jun 22, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Physical Layer Communications	Jun 22, 2021	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available	0
Agnostic Reinforcement Learning with Low-Rank MDPs and Rich Observations	Jun 22, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Reduction-Based Framework for Conservative Bandits and Reinforcement Learning	Jun 22, 2021	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Lifted Model Checking for Relational MDPs	Jun 22, 2021	modelModel-based Reinforcement Learning	—Unverified	0
Distributed Heuristic Multi-Agent Path Finding with Communication	Jun 21, 2021	Multi-Agent Path FindingQ-Learning	CodeCode Available	1
Cogment: Open Source Framework For Distributed Multi-actor Training, Deployment & Operations	Jun 21, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Emphatic Algorithms for Deep Reinforcement Learning	Jun 21, 2021	Atari GamesDeep Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 317 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified