Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7251–7300 of 15113 papers

Title	Date	Tasks	Status	Hype
Experience Replay More When It's a Key Transition in Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Efficient Wasserstein and Sinkhorn Policy Optimization	Sep 29, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Adaptive Graph Capsule Convolutional Networks	Sep 29, 2021	GPUReinforcement Learning (RL)	—Unverified	0
Decoupling Strategy and Surface Realization for Task-oriented Dialogues	Sep 29, 2021	Reinforcement Learning (RL)Style Transfer	—Unverified	0
Evolution Strategies as an Alternate Learning method for Hierarchical Reinforcement Learning	Sep 29, 2021	Hierarchical Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Learning Controllable Elements Oriented Representations for Reinforcement Learning	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Interpreting Reinforcement Policies through Local Behaviors	Sep 29, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Flexible Measurement of Diversity in Datasets with Random Network Distillation	Sep 29, 2021	DiversityImage Generation	—Unverified	0
A General Theory of Relativity in Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
HyperDQN: A Randomized Exploration Method for Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	1
Greedy-based Value Representation for Efficient Coordination in Multi-agent Reinforcement Learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Reinforcement Learning Experimentation in PyTorch	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Exploring the Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Decentralized Cooperative Multi-Agent Reinforcement Learning with Exploration	Sep 29, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
CausalDyna: Improving Generalization of Dyna-style Reinforcement Learning via Counterfactual-Based Data Augmentation	Sep 29, 2021	counterfactualData Augmentation	—Unverified	0
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified	0
Evolutionary Diversity Optimization with Clustering-based Selection for Reinforcement Learning	Sep 29, 2021	Clusteringcontinuous-control	—Unverified	0
Assessing Deep Reinforcement Learning Policies via Natural Corruptions at the Edge of Imperceptibility	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Auto-Encoding Inverse Reinforcement Learning	Sep 29, 2021	Decision MakingImitation Learning	—Unverified	0
Better state exploration using action sequence equivalence	Sep 29, 2021	Open-Ended Question Answeringreinforcement-learning	—Unverified	0
Deep Ensemble Policy Learning	Sep 29, 2021	DiversityEnsemble Learning	—Unverified	0
A Principled Permutation Invariant Approach to Mean-Field Multi-Agent Reinforcement Learning	Sep 29, 2021	Inductive BiasMulti-agent Reinforcement Learning	—Unverified	0
Bayesian Exploration for Lifelong Reinforcement Learning	Sep 29, 2021	Lifelong learningreinforcement-learning	—Unverified	0
An Optics Controlling Environment and Reinforcement Learning Benchmarks	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Fully Decentralized Model-based Policy Optimization with Networked Agents	Sep 29, 2021	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Combinatorial Reinforcement Learning Based Scheduling for DNN Execution on Edge	Sep 29, 2021	Edge-computingreinforcement-learning	—Unverified	0
Hypothesis Driven Coordinate Ascent for Reinforcement Learning	Sep 29, 2021	MuJoCoOpenAI Gym	—Unverified	0
Adversarial Style Transfer for Robust Policy Optimization in Reinforcement Learning	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Perturbation for Efficient Exploration in Distributional Reinforcement Learning	Sep 29, 2021	Atari GamesDescriptive	—Unverified	0
Fourier Features in Reinforcement Learning with Neural Networks	Sep 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
AARL: Automated Auxiliary Loss for Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Reinforcement Learning with Shared Resource in Inventory Management	Sep 29, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified	0
Rewardless Open-Ended Learning (ROEL)	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
The guide and the explorer: smart agents for resource-limited iterated batch reinforcement learning	Sep 29, 2021	AcrobotModel Predictive Control	—Unverified	0
Semi-supervised Offline Reinforcement Learning with Pre-trained Decision Transformers	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Offline Reinforcement Learning with Resource Constrained Online Deployment	Sep 29, 2021	D4RLOffline RL	—Unverified	0
Offline Reinforcement Learning with In-sample Q-Learning	Sep 29, 2021	D4RLOffline RL	CodeCode Available	1
Pretraining for Language Conditioned Imitation with Transformers	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reasoning With Hierarchical Symbols: Reclaiming Symbolic Policies For Visual Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
PDQN - A Deep Reinforcement Learning Method for Planning with Long Delays: Optimization of Manufacturing Dispatching	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Theoretical understanding of adversarial reinforcement learning via mean-field optimal control	Sep 29, 2021	Generalization Boundsreinforcement-learning	—Unverified	0
Pareto Policy Adaptation	Sep 29, 2021	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
SPP-RL: State Planning Policy Reinforcement Learning	Sep 29, 2021	MuJoCoreinforcement-learning	—Unverified	0
Reinforcement Learning State Estimation for High-Dimensional Nonlinear Systems	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Towards Understanding Distributional Reinforcement Learning: Regularization, Optimization, Acceleration and Sinkhorn Algorithm	Sep 29, 2021	Atari GamesDistributional Reinforcement Learning	—Unverified	0
^2-exploration for Reinforcement Learning	Sep 29, 2021	General Reinforcement LearningQ-Learning	—Unverified	0
MOBA: Multi-teacher Model Based Reinforcement Learning	Sep 29, 2021	Decision MakingKnowledge Distillation	—Unverified	0
Rethinking Pareto Approaches in Constrained Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning with Ex-Post Max-Min Fairness	Sep 29, 2021	Fairnessreinforcement-learning	—Unverified	0
Weakly-Supervised Learning of Disentangled and Interpretable Skills for Hierarchical Reinforcement Learning	Sep 29, 2021	DecoderHierarchical Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 146 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified