Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8051–8100 of 15113 papers

Title	Date	Tasks	Status	Hype
PlayVirtual: Augmenting Cycle-Consistent Virtual Trajectories for Reinforcement Learning	Jun 8, 2021	Continuous Control (100k environment steps)Continuous Control (500k environment steps)	CodeCode Available	1
RewardsOfSum: Exploring Reinforcement Learning Rewards for Summarisation	Jun 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Don't Get Yourself into Trouble! Risk-aware Decision-Making for Autonomous Vehicles	Jun 8, 2021	Autonomous VehiclesDecision Making	—Unverified	0
Curriculum Design for Teaching via Demonstrations: Theory and Applications	Jun 8, 2021	Decision MakingReinforcement Learning (RL)	CodeCode Available	0
A Deep Value-network Based Approach for Multi-Driver Order Dispatching	Jun 8, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Markov State Abstractions for Deep Reinforcement Learning	Jun 8, 2021	continuous-controlContinuous Control	CodeCode Available	1
Left Ventricle Contouring in Cardiac Images Based on Deep Reinforcement Learning	Jun 8, 2021	Deep Reinforcement LearningImage Segmentation	CodeCode Available	0
Dynamic Sparse Training for Deep Reinforcement Learning	Jun 8, 2021	continuous-controlContinuous Control	CodeCode Available	1
There Is No Turning Back: A Self-Supervised Approach for Reversibility-Aware Reinforcement Learning	Jun 8, 2021	Decision MakingReinforcement Learning (RL)	—Unverified	0
Towards Practical Credit Assignment for Deep Reinforcement Learning	Jun 8, 2021	Atari GamesDeep Reinforcement Learning	—Unverified	0
Residual Feedback Learning for Contact-Rich Manipulation Tasks with Uncertainty	Jun 8, 2021	Contact-rich ManipulationPosition	—Unverified	0
Verifiable and Compositional Reinforcement Learning Systems	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Correcting Momentum in Temporal Difference Learning	Jun 7, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Entropy Regularized Reinforcement Learning Using Large Deviation Theory	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Computational Model of Representation Learning in the Brain Cortex, Integrating Unsupervised and Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Concave Utility Reinforcement Learning: the Mean-Field Game Viewpoint	Jun 7, 2021	Imitation Learningreinforcement-learning	—Unverified	0
Causal Influence Detection for Improving Efficiency in Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Learning to Guide a Saturation-Based Theorem Prover	Jun 7, 2021	Automated Theorem ProvingGraph Neural Network	—Unverified	0
Identifiability in inverse reinforcement learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Combinatorial Node Labeling Algorithms	Jun 7, 2021	BIG-bench Machine LearningGraph Attention	—Unverified	0
Task-driven Semantic Coding via Reinforcement Learning	Jun 7, 2021	Face DetectionLicense Plate Detection	CodeCode Available	1
XIRL: Cross-embodiment Inverse Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Multi-agent Battery Storage Management using MPC-based Reinforcement Learning	Jun 7, 2021	ManagementModel Predictive Control	—Unverified	0
Towards robust and domain agnostic reinforcement learning competitions	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
The Power of Exploiter: Provable Multi-Agent RL in Large State Spaces	Jun 7, 2021	Reinforcement Learning (RL)	—Unverified	0
Average-Reward Reinforcement Learning with Trust Region Methods	Jun 7, 2021	continuous-controlContinuous Control	—Unverified	0
Explainable Artificial Intelligence (XAI) for Increasing User Trust in Deep Reinforcement Learning Driven Autonomous Systems	Jun 7, 2021	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified	0
Learning without Knowing: Unobserved Context in Continuous Transfer Reinforcement Learning	Jun 7, 2021	Autonomous DrivingImitation Learning	—Unverified	0
Believe What You See: Implicit Constraint Approach for Offline Multi-Agent Reinforcement Learning	Jun 7, 2021	Multi-agent Reinforcement LearningOffline RL	CodeCode Available	1
DisTop: Discovering a Topological representation to learn diverse and rewarding skills	Jun 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Problems by Reinforcement Learning	Jun 6, 2021	Reinforcement Learning (RL)	—Unverified	0
Efficient Continuous Control with Double Actors and Regularized Critics	Jun 6, 2021	continuous-controlContinuous Control	CodeCode Available	1
Distributional Reinforcement Learning with Unconstrained Monotonic Neural Networks	Jun 6, 2021	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available	1
3D UAV Trajectory and Data Collection Optimisation via Deep Reinforcement Learning	Jun 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Control-Oriented Model-Based Reinforcement Learning with Implicit Differentiation	Jun 6, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
ScheduleNet: Learn to solve multi-agent scheduling problems with reinforcement learning	Jun 6, 2021	Decision MakingGraph Attention	CodeCode Available	1
MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning	Jun 5, 2021	Atari GamesCPU	CodeCode Available	1
Learning Routines for Effective Off-Policy Reinforcement Learning	Jun 5, 2021	Computational Efficiencyreinforcement-learning	—Unverified	0
Heuristic-Guided Reinforcement Learning	Jun 5, 2021	Decision Makingreinforcement-learning	—Unverified	0
Same State, Different Task: Continual Reinforcement Learning without Interference	Jun 5, 2021	Continual Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning for Assignment Problem with Time Constraints	Jun 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Resource Allocation in Disaggregated Data Centre Systems with Reinforcement Learning	Jun 4, 2021	CPUreinforcement-learning	—Unverified	0
Online reinforcement learning with sparse rewards through an active inference capsule	Jun 4, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Model-agnostic and Scalable Counterfactual Explanations via Reinforcement Learning	Jun 4, 2021	counterfactualDeep Reinforcement Learning	CodeCode Available	2
Differentiable Architecture Search for Reinforcement Learning	Jun 4, 2021	Neural Architecture Searchreinforcement-learning	CodeCode Available	1
Robustifying Reinforcement Learning Policies with L_1 Adaptive Control	Jun 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Detecting and Adapting to Novelty in Games	Jun 4, 2021	Knowledge GraphsModel-based Reinforcement Learning	—Unverified	0
Be Considerate: Objectives, Side Effects, and Deciding How to Act	Jun 4, 2021	Decision MakingReinforcement Learning (RL)	—Unverified	0
Cross-Trajectory Representation Learning for Zero-Shot Generalization in RL	Jun 4, 2021	Reinforcement Learning (RL)Representation Learning	CodeCode Available	0
Celebrating Diversity in Shared Multi-Agent Reinforcement Learning	Jun 4, 2021	DiversityMulti-agent Reinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 162 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified