Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8251–8300 of 15113 papers

Title	Date	Tasks	Status
Greedy-based Value Representation for Efficient Coordination in Multi-agent Reinforcement Learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Deep Inverse Reinforcement Learning via Adversarial One-Class Classification	Sep 29, 2021	ClassificationOne-Class Classification	—Unverified
Interpreting Reinforcement Policies through Local Behaviors	Sep 29, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive Graph Capsule Convolutional Networks	Sep 29, 2021	GPUReinforcement Learning (RL)	—Unverified
Bayesian Exploration for Lifelong Reinforcement Learning	Sep 29, 2021	Lifelong learningreinforcement-learning	—Unverified
Deep Learning of Intrinsically Motivated Options in the Arcade Learning Environment	Sep 29, 2021	Atari GamesBenchmarking	—Unverified
Combinatorial Reinforcement Learning Based Scheduling for DNN Execution on Edge	Sep 29, 2021	Edge-computingreinforcement-learning	—Unverified
Joint Self-Supervised Learning for Vision-based Reinforcement Learning	Sep 29, 2021	Autonomous Drivingcontinuous-control	—Unverified
A Principled Permutation Invariant Approach to Mean-Field Multi-Agent Reinforcement Learning	Sep 29, 2021	Inductive BiasMulti-agent Reinforcement Learning	—Unverified
Faster Reinforcement Learning with Value Target Lower Bounding	Sep 29, 2021	Atari Gamescontinuous-control	—Unverified
DSDF: Coordinated look-ahead strategy in stochastic multi-agent reinforcement learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified
DiBB: Distributing Black-Box Optimization	Sep 29, 2021	Problem DecompositionReinforcement Learning (RL)	—Unverified
Closed-Loop Control of Additive Manufacturing via Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Exploring the Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Boosted Curriculum Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reachability Traces for Curriculum Design in Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Text Generation with Efficient (Soft) Q-Learning	Sep 29, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
That Escalated Quickly: Compounding Complexity by Editing Levels at the Frontier of Agent Capabilities	Sep 29, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
OVD-Explorer: A General Information-theoretic Exploration Approach for Reinforcement Learning	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified
	Sep 29, 2021	AttributeDecision Making	—Unverified
Sequential Communication in Multi-Agent Reinforcement Learning	Sep 29, 2021	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Semi-supervised Offline Reinforcement Learning with Pre-trained Decision Transformers	Sep 29, 2021	D4RLOffline RL	—Unverified
The Essential Elements of Offline RL via Supervised Learning	Sep 29, 2021	Offline RLreinforcement-learning	—Unverified
The guide and the explorer: smart agents for resource-limited iterated batch reinforcement learning	Sep 29, 2021	AcrobotModel Predictive Control	—Unverified
Resmax: An Alternative Soft-Greedy Operator for Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Plan Your Target and Learn Your Skills: State-Only Imitation Learning via Decoupled Policy Optimization	Sep 29, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified
Self-Supervised Structured Representations for Deep Reinforcement Learning	Sep 29, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Multi-Agent Reinforcement Learning with Shared Resource in Inventory Management	Sep 29, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified
Theoretical understanding of adversarial reinforcement learning via mean-field optimal control	Sep 29, 2021	Generalization Boundsreinforcement-learning	—Unverified
Multi-batch Reinforcement Learning via Sample Transfer and Imitation Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
The Remarkable Effectiveness of Combining Policy and Value Networks in A*-based Deep RL for AI Planning	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Offline-Online Reinforcement Learning: Extending Batch and Online RL	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
P4O: Efficient Deep Reinforcement Learning with Predictive Processing Proximal Policy Optimization	Sep 29, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Rethinking Pareto Approaches in Constrained Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Offline Pre-trained Multi-Agent Decision Transformer	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Should I Run Offline Reinforcement Learning or Behavioral Cloning?	Sep 29, 2021	Atari GamesDiagnostic	—Unverified
Selective Token Generation for Few-shot Language Modeling	Sep 29, 2021	Data-to-Text GenerationLanguage Modeling	—Unverified
Offline Reinforcement Learning for Large Scale Language Action Spaces	Sep 29, 2021	Language ModelingLanguage Modelling	—Unverified
Task-driven Discovery of Perceptual Schemas for Generalization in Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningObject	—Unverified
Targeted Environment Design from Offline Data	Sep 29, 2021	Offline RLReinforcement Learning (RL)	—Unverified
Revisiting the Monotonicity Constraint in Cooperative Multi-Agent Reinforcement Learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Offline Reinforcement Learning with Resource Constrained Online Deployment	Sep 29, 2021	D4RLOffline RL	—Unverified
Towards Understanding Distributional Reinforcement Learning: Regularization, Optimization, Acceleration and Sinkhorn Algorithm	Sep 29, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified
Towards Unknown-aware Deep Q-Learning	Sep 29, 2021	Deep Reinforcement LearningOut of Distribution (OOD) Detection	—Unverified
Model-based Reinforcement Learning with Ensembled Model-value Expansion	Sep 29, 2021	modelModel-based Reinforcement Learning	—Unverified
Rewardless Open-Ended Learning (ROEL)	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Transformers are Meta-Reinforcement Learners	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Triangular Dropout: Variable Network Width without Retraining	Sep 29, 2021	Lifelong learningReinforcement Learning (RL)	—Unverified
MOBA: Multi-teacher Model Based Reinforcement Learning	Sep 29, 2021	Decision MakingKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 166 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified