Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8901–8925 of 15113 papers

Title	Date	Tasks	Status
Multi-agent Battery Storage Management using MPC-based Reinforcement Learning	Jun 7, 2021	ManagementModel Predictive Control	—Unverified
Towards robust and domain agnostic reinforcement learning competitions	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
XIRL: Cross-embodiment Inverse Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
The Power of Exploiter: Provable Multi-Agent RL in Large State Spaces	Jun 7, 2021	Reinforcement Learning (RL)	—Unverified
Correcting Momentum in Temporal Difference Learning	Jun 7, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Learning to Guide a Saturation-Based Theorem Prover	Jun 7, 2021	Automated Theorem ProvingGraph Neural Network	—Unverified
A Computational Model of Representation Learning in the Brain Cortex, Integrating Unsupervised and Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Explainable Artificial Intelligence (XAI) for Increasing User Trust in Deep Reinforcement Learning Driven Autonomous Systems	Jun 7, 2021	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified
Average-Reward Reinforcement Learning with Trust Region Methods	Jun 7, 2021	continuous-controlContinuous Control	—Unverified
Concave Utility Reinforcement Learning: the Mean-Field Game Viewpoint	Jun 7, 2021	Imitation Learningreinforcement-learning	—Unverified
Learning Combinatorial Node Labeling Algorithms	Jun 7, 2021	BIG-bench Machine LearningGraph Attention	—Unverified
Entropy Regularized Reinforcement Learning Using Large Deviation Theory	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Identifiability in inverse reinforcement learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning without Knowing: Unobserved Context in Continuous Transfer Reinforcement Learning	Jun 7, 2021	Autonomous DrivingImitation Learning	—Unverified
DisTop: Discovering a Topological representation to learn diverse and rewarding skills	Jun 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
3D UAV Trajectory and Data Collection Optimisation via Deep Reinforcement Learning	Jun 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Problems by Reinforcement Learning	Jun 6, 2021	Reinforcement Learning (RL)	—Unverified
Heuristic-Guided Reinforcement Learning	Jun 5, 2021	Decision Makingreinforcement-learning	—Unverified
Learning Routines for Effective Off-Policy Reinforcement Learning	Jun 5, 2021	Computational Efficiencyreinforcement-learning	—Unverified
Reinforcement Learning for Assignment Problem with Time Constraints	Jun 5, 2021	reinforcement-learningReinforcement Learning	—Unverified
Resource Allocation in Disaggregated Data Centre Systems with Reinforcement Learning	Jun 4, 2021	CPUreinforcement-learning	—Unverified
Robustifying Reinforcement Learning Policies with L_1 Adaptive Control	Jun 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Detecting and Adapting to Novelty in Games	Jun 4, 2021	Knowledge GraphsModel-based Reinforcement Learning	—Unverified
Cross-Trajectory Representation Learning for Zero-Shot Generalization in RL	Jun 4, 2021	Reinforcement Learning (RL)Representation Learning	CodeCode Available
Be Considerate: Objectives, Side Effects, and Deciding How to Act	Jun 4, 2021	Decision MakingReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 357 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified