Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8901–8950 of 15113 papers

Title	Date	Tasks	Status
Multi-agent Battery Storage Management using MPC-based Reinforcement Learning	Jun 7, 2021	ManagementModel Predictive Control	—Unverified
Towards robust and domain agnostic reinforcement learning competitions	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
XIRL: Cross-embodiment Inverse Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
The Power of Exploiter: Provable Multi-Agent RL in Large State Spaces	Jun 7, 2021	Reinforcement Learning (RL)	—Unverified
Correcting Momentum in Temporal Difference Learning	Jun 7, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Learning to Guide a Saturation-Based Theorem Prover	Jun 7, 2021	Automated Theorem ProvingGraph Neural Network	—Unverified
A Computational Model of Representation Learning in the Brain Cortex, Integrating Unsupervised and Reinforcement Learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Explainable Artificial Intelligence (XAI) for Increasing User Trust in Deep Reinforcement Learning Driven Autonomous Systems	Jun 7, 2021	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified
Average-Reward Reinforcement Learning with Trust Region Methods	Jun 7, 2021	continuous-controlContinuous Control	—Unverified
Concave Utility Reinforcement Learning: the Mean-Field Game Viewpoint	Jun 7, 2021	Imitation Learningreinforcement-learning	—Unverified
Learning Combinatorial Node Labeling Algorithms	Jun 7, 2021	BIG-bench Machine LearningGraph Attention	—Unverified
Entropy Regularized Reinforcement Learning Using Large Deviation Theory	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Identifiability in inverse reinforcement learning	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning without Knowing: Unobserved Context in Continuous Transfer Reinforcement Learning	Jun 7, 2021	Autonomous DrivingImitation Learning	—Unverified
DisTop: Discovering a Topological representation to learn diverse and rewarding skills	Jun 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
3D UAV Trajectory and Data Collection Optimisation via Deep Reinforcement Learning	Jun 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Problems by Reinforcement Learning	Jun 6, 2021	Reinforcement Learning (RL)	—Unverified
Heuristic-Guided Reinforcement Learning	Jun 5, 2021	Decision Makingreinforcement-learning	—Unverified
Learning Routines for Effective Off-Policy Reinforcement Learning	Jun 5, 2021	Computational Efficiencyreinforcement-learning	—Unverified
Reinforcement Learning for Assignment Problem with Time Constraints	Jun 5, 2021	reinforcement-learningReinforcement Learning	—Unverified
Resource Allocation in Disaggregated Data Centre Systems with Reinforcement Learning	Jun 4, 2021	CPUreinforcement-learning	—Unverified
Robustifying Reinforcement Learning Policies with L_1 Adaptive Control	Jun 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Detecting and Adapting to Novelty in Games	Jun 4, 2021	Knowledge GraphsModel-based Reinforcement Learning	—Unverified
Cross-Trajectory Representation Learning for Zero-Shot Generalization in RL	Jun 4, 2021	Reinforcement Learning (RL)Representation Learning	CodeCode Available
Be Considerate: Objectives, Side Effects, and Deciding How to Act	Jun 4, 2021	Decision MakingReinforcement Learning (RL)	—Unverified
Hyperbolically-Discounted Reinforcement Learning on Reward-Punishment Framework	Jun 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Feeling of Presence Maximization: mmWave-Enabled Virtual Reality Meets Deep Reinforcement Learning	Jun 3, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Grounding Complex Navigational Instructions Using Scene Graphs	Jun 3, 2021	Question Answeringreinforcement-learning	—Unverified
LiMIIRL: Lightweight Multiple-Intent Inverse Reinforcement Learning	Jun 3, 2021	Clusteringreinforcement-learning	—Unverified
MICo: Improved representations via sampling-based state similarity for Markov decision processes	Jun 3, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Optimization-Based Algebraic Multigrid Coarsening Using Reinforcement Learning	Jun 3, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Safe RAN control: A Symbolic Reinforcement Learning Approach	Jun 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning to Play Piano with Dexterous Hands and Touch	Jun 3, 2021	Reinforcement Learning (RL)	—Unverified
Robot in a China Shop: Using Reinforcement Learning for Location-Specific Navigation Behaviour	Jun 2, 2021	Multi-Task LearningReinforcement Learning (RL)	—Unverified
Towards Deeper Deep Reinforcement Learning with Spectral Normalization	Jun 2, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Variational Empowerment as Representation Learning for Goal-Based Reinforcement Learning	Jun 2, 2021	reinforcement-learningReinforcement Learning	—Unverified
Expected Scalarised Returns Dominance: A New Solution Concept for Multi-Objective Decision Making	Jun 2, 2021	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
Learning to schedule job-shop problems: Representation and policy learning using graph neural network and reinforcement learning	Jun 2, 2021	Decision MakingGraph Neural Network	—Unverified
Design and Comparison of Reward Functions in Reinforcement Learning for Energy Management of Sensor Nodes	Jun 2, 2021	energy managementManagement	—Unverified
Improving Long-Term Metrics in Recommendation Systems using Short-Horizon Reinforcement Learning	Jun 1, 2021	Offline RLRecommendation Systems	—Unverified
An Entropy Regularization Free Mechanism for Policy-based Reinforcement Learning	Jun 1, 2021	Atari GamesDiversity	—Unverified
A Coarse to Fine Question Answering System based on Reinforcement Learning	Jun 1, 2021	Deep Reinforcement LearningQuestion Answering	—Unverified
Ad Headline Generation using Self-Critical Masked Language Model	Jun 1, 2021	Headline GenerationLanguage Modeling	—Unverified
Quantitative Day Trading from Natural Language using Reinforcement Learning	Jun 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reward is enough for convex MDPs	Jun 1, 2021	Reinforcement Learning (RL)	—Unverified
Search from History and Reason for Future: Two-stage Reasoning on Temporal Knowledge Graphs	Jun 1, 2021	Knowledge GraphsReinforcement Learning (RL)	—Unverified
Shapley Counterfactual Credits for Multi-Agent Reinforcement Learning	Jun 1, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified
Reinforce Security: A Model-Free Approach Towards Secure Wiretap Coding	Jun 1, 2021	Mutual Information Estimationreinforcement-learning	—Unverified
Procedural Content Generation: Better Benchmarks for Transfer Reinforcement Learning	May 31, 2021	BenchmarkingDeep Learning	—Unverified
Reinforcement Learning-based Dynamic Service Placement in Vehicular Networks	May 31, 2021	Edge-computingFairness	—Unverified

Show:10 25 50

← PrevPage 179 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified