Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7251–7275 of 15113 papers

Title	Date	Tasks	Status	Hype
Experience Replay More When It's a Key Transition in Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Efficient Wasserstein and Sinkhorn Policy Optimization	Sep 29, 2021	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Adaptive Graph Capsule Convolutional Networks	Sep 29, 2021	GPUReinforcement Learning (RL)	—Unverified	0
Decoupling Strategy and Surface Realization for Task-oriented Dialogues	Sep 29, 2021	Reinforcement Learning (RL)Style Transfer	—Unverified	0
Evolution Strategies as an Alternate Learning method for Hierarchical Reinforcement Learning	Sep 29, 2021	Hierarchical Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Learning Controllable Elements Oriented Representations for Reinforcement Learning	Sep 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Interpreting Reinforcement Policies through Local Behaviors	Sep 29, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Flexible Measurement of Diversity in Datasets with Random Network Distillation	Sep 29, 2021	DiversityImage Generation	—Unverified	0
A General Theory of Relativity in Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
HyperDQN: A Randomized Exploration Method for Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	1
Greedy-based Value Representation for Efficient Coordination in Multi-agent Reinforcement Learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Reinforcement Learning Experimentation in PyTorch	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Exploring the Robustness of Distributional Reinforcement Learning against Noisy State Observations	Sep 29, 2021	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Decentralized Cooperative Multi-Agent Reinforcement Learning with Exploration	Sep 29, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
CausalDyna: Improving Generalization of Dyna-style Reinforcement Learning via Counterfactual-Based Data Augmentation	Sep 29, 2021	counterfactualData Augmentation	—Unverified	0
Adaptive Q-learning for Interaction-Limited Reinforcement Learning	Sep 29, 2021	Offline RLQ-Learning	—Unverified	0
Evolutionary Diversity Optimization with Clustering-based Selection for Reinforcement Learning	Sep 29, 2021	Clusteringcontinuous-control	—Unverified	0
Assessing Deep Reinforcement Learning Policies via Natural Corruptions at the Edge of Imperceptibility	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Auto-Encoding Inverse Reinforcement Learning	Sep 29, 2021	Decision MakingImitation Learning	—Unverified	0
Better state exploration using action sequence equivalence	Sep 29, 2021	Open-Ended Question Answeringreinforcement-learning	—Unverified	0
Deep Ensemble Policy Learning	Sep 29, 2021	DiversityEnsemble Learning	—Unverified	0
A Principled Permutation Invariant Approach to Mean-Field Multi-Agent Reinforcement Learning	Sep 29, 2021	Inductive BiasMulti-agent Reinforcement Learning	—Unverified	0
Bayesian Exploration for Lifelong Reinforcement Learning	Sep 29, 2021	Lifelong learningreinforcement-learning	—Unverified	0
An Optics Controlling Environment and Reinforcement Learning Benchmarks	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Fully Decentralized Model-based Policy Optimization with Networked Agents	Sep 29, 2021	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 291 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified