Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2076–2100 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning via Fenchel-Rockafellar Duality	Jan 7, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Blue River Controls: A toolkit for Reinforcement Learning Control Systems on Hardware	Jan 7, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning for Active Human Pose Estimation	Jan 7, 2020	3D Human Pose EstimationDeep Reinforcement Learning	CodeCode Available	1
A Boolean Task Algebra for Reinforcement Learning	Jan 6, 2020	Lifelong learningNegation	CodeCode Available	1
Represented Value Function Approach for Large Scale Multi Agent Reinforcement Learning	Jan 4, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
MushroomRL: Simplifying Reinforcement Learning Research	Jan 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Meta Reinforcement Learning with Autonomous Inference of Subtask Dependencies	Jan 1, 2020	Efficient ExplorationMeta Reinforcement Learning	CodeCode Available	1
CURL: Contrastive Unsupervised Representation Learning for Reinforcement Learning	Jan 1, 2020	Contrastive Learningreinforcement-learning	CodeCode Available	1
An Optimistic Perspective on Offline Deep Reinforcement Learning	Jan 1, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Variational Imitation Learning with Diverse-quality Demonstrations	Jan 1, 2020	continuous-controlContinuous Control	CodeCode Available	1
Bridging the Gap Between f-GANs and Wasserstein GANs	Jan 1, 2020	Density Ratio EstimationImage Generation	CodeCode Available	1
Learning to Navigate in Synthetically Accessible Chemical Space Using Reinforcement Learning	Jan 1, 2020	Drug DiscoveryNavigate	CodeCode Available	1
Prediction-Guided Multi-Objective Reinforcement Learning for Continuous Robot Control	Jan 1, 2020	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available	1
PAC Confidence Sets for Deep Neural Networks via Calibrated Prediction	Dec 31, 2019	Generalization BoundsLearning Theory	CodeCode Available	1
Pseudo Random Number Generation: a Reinforcement Learning approach	Dec 15, 2019	BIG-bench Machine Learningreinforcement-learning	CodeCode Available	1
Imitation Learning via Off-Policy Distribution Matching	Dec 10, 2019	Imitation LearningReinforcement Learning	CodeCode Available	1
VALAN: Vision and Language Agent Navigation	Dec 6, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning	Dec 4, 2019	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1
Dream to Control: Learning Behaviors by Latent Imagination	Dec 3, 2019	Continuous Controlreinforcement-learning	CodeCode Available	1
LIIR: Learning Individual Intrinsic Reward in Multi-Agent Reinforcement Learning	Dec 1, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Staying up to Date with Online Content Changes Using Reinforcement Learning for Scheduling	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
ORL: Reinforcement Learning Benchmarks for Online Stochastic Optimization Problems	Nov 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning	Nov 12, 2019	Combinatorial OptimizationGraph Embedding	CodeCode Available	1
A Deep Reinforcement Learning Approach to First-Order Logic Theorem Proving	Nov 5, 2019	Automated Theorem ProvingDeep Reinforcement Learning	CodeCode Available	1
PIC: Permutation Invariant Critic for Multi-Agent Deep Reinforcement Learning	Oct 31, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 84 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified