Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8076–8100 of 15113 papers

Title	Date	Tasks	Status	Hype
Average-Reward Reinforcement Learning with Trust Region Methods	Jun 7, 2021	continuous-controlContinuous Control	—Unverified	0
Explainable Artificial Intelligence (XAI) for Increasing User Trust in Deep Reinforcement Learning Driven Autonomous Systems	Jun 7, 2021	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified	0
Learning without Knowing: Unobserved Context in Continuous Transfer Reinforcement Learning	Jun 7, 2021	Autonomous DrivingImitation Learning	—Unverified	0
Believe What You See: Implicit Constraint Approach for Offline Multi-Agent Reinforcement Learning	Jun 7, 2021	Multi-agent Reinforcement LearningOffline RL	CodeCode Available	1
DisTop: Discovering a Topological representation to learn diverse and rewarding skills	Jun 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Problems by Reinforcement Learning	Jun 6, 2021	Reinforcement Learning (RL)	—Unverified	0
Efficient Continuous Control with Double Actors and Regularized Critics	Jun 6, 2021	continuous-controlContinuous Control	CodeCode Available	1
Distributional Reinforcement Learning with Unconstrained Monotonic Neural Networks	Jun 6, 2021	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	1
3D UAV Trajectory and Data Collection Optimisation via Deep Reinforcement Learning	Jun 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Control-Oriented Model-Based Reinforcement Learning with Implicit Differentiation	Jun 6, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
ScheduleNet: Learn to solve multi-agent scheduling problems with reinforcement learning	Jun 6, 2021	Decision MakingGraph Attention	CodeCode Available	1
MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning	Jun 5, 2021	Atari GamesCPU	CodeCode Available	1
Learning Routines for Effective Off-Policy Reinforcement Learning	Jun 5, 2021	Computational Efficiencyreinforcement-learning	—Unverified	0
Heuristic-Guided Reinforcement Learning	Jun 5, 2021	Decision Makingreinforcement-learning	—Unverified	0
Same State, Different Task: Continual Reinforcement Learning without Interference	Jun 5, 2021	Continual Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning for Assignment Problem with Time Constraints	Jun 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Resource Allocation in Disaggregated Data Centre Systems with Reinforcement Learning	Jun 4, 2021	CPUreinforcement-learning	—Unverified	0
Online reinforcement learning with sparse rewards through an active inference capsule	Jun 4, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Model-agnostic and Scalable Counterfactual Explanations via Reinforcement Learning	Jun 4, 2021	counterfactualDeep Reinforcement Learning	CodeCode Available	2
Differentiable Architecture Search for Reinforcement Learning	Jun 4, 2021	Neural Architecture Searchreinforcement-learning	CodeCode Available	1
Robustifying Reinforcement Learning Policies with L_1 Adaptive Control	Jun 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Detecting and Adapting to Novelty in Games	Jun 4, 2021	Knowledge GraphsModel-based Reinforcement Learning	—Unverified	0
Be Considerate: Objectives, Side Effects, and Deciding How to Act	Jun 4, 2021	Decision MakingReinforcement Learning (RL)	—Unverified	0
Cross-Trajectory Representation Learning for Zero-Shot Generalization in RL	Jun 4, 2021	Reinforcement Learning (RL)Representation Learning	CodeCode Available	0
Celebrating Diversity in Shared Multi-Agent Reinforcement Learning	Jun 4, 2021	DiversityMulti-agent Reinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 324 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified