Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7276–7300 of 15113 papers

Title	Date	Tasks	Status	Hype
Combinatorial Reinforcement Learning Based Scheduling for DNN Execution on Edge	Sep 29, 2021	Edge-computingreinforcement-learning	—Unverified	0
Hypothesis Driven Coordinate Ascent for Reinforcement Learning	Sep 29, 2021	MuJoCoOpenAI Gym	—Unverified	0
Adversarial Style Transfer for Robust Policy Optimization in Reinforcement Learning	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified	0
Fourier Features in Reinforcement Learning with Neural Networks	Sep 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
AARL: Automated Auxiliary Loss for Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Reinforcement Learning with Shared Resource in Inventory Management	Sep 29, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified	0
Rewardless Open-Ended Learning (ROEL)	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
The guide and the explorer: smart agents for resource-limited iterated batch reinforcement learning	Sep 29, 2021	AcrobotModel Predictive Control	—Unverified	0
Semi-supervised Offline Reinforcement Learning with Pre-trained Decision Transformers	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Offline Reinforcement Learning with Resource Constrained Online Deployment	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Offline Reinforcement Learning with In-sample Q-Learning	Sep 29, 2021	D4RLOffline RL	CodeCode Available	1
Pretraining for Language Conditioned Imitation with Transformers	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reasoning With Hierarchical Symbols: Reclaiming Symbolic Policies For Visual Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
PDQN - A Deep Reinforcement Learning Method for Planning with Long Delays: Optimization of Manufacturing Dispatching	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Theoretical understanding of adversarial reinforcement learning via mean-field optimal control	Sep 29, 2021	Generalization Boundsreinforcement-learning	—Unverified	0
Pareto Policy Adaptation	Sep 29, 2021	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
SPP-RL: State Planning Policy Reinforcement Learning	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified	0
Reinforcement Learning State Estimation for High-Dimensional Nonlinear Systems	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Towards Understanding Distributional Reinforcement Learning: Regularization, Optimization, Acceleration and Sinkhorn Algorithm	Sep 29, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified	0
^2-exploration for Reinforcement Learning	Sep 29, 2021	General Reinforcement LearningQ-Learning	—Unverified	0
MOBA: Multi-teacher Model Based Reinforcement Learning	Sep 29, 2021	Decision MakingKnowledge Distillation	—Unverified	0
Rethinking Pareto Approaches in Constrained Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning with Ex-Post Max-Min Fairness	Sep 29, 2021	Fairnessreinforcement-learning	—Unverified	0
Weakly-Supervised Learning of Disentangled and Interpretable Skills for Hierarchical Reinforcement Learning	Sep 29, 2021	DecoderHierarchical Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 292 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified