Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9451–9475 of 15113 papers

Title	Date	Tasks	Status	Hype
Critic PI2: Master Continuous Planning via Policy Improvement with Path Integrals and Deep Actor-Critic Reinforcement Learning	Nov 13, 2020	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning of Transition States	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
DeepMind Lab2D	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Active Reinforcement Learning: Observing Rewards at a Cost	Nov 13, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified	0
A Review of Uncertainty Quantification in Deep Learning: Techniques, Applications and Challenges	Nov 12, 2020	Decision MakingEnsemble Learning	—Unverified	0
Imposing Robust Structured Control Constraint on Reinforcement Learning of Linear Quadratic Regulator	Nov 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Gaussian RAM: Lightweight Image Classification via Stochastic Retina-Inspired Glimpse and Reinforcement Learning	Nov 12, 2020	ClassificationGeneral Classification	CodeCode Available	1
Hierarchical reinforcement learning for efficient exploration and transfer	Nov 12, 2020	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified	0
Griddly: A platform for AI research in games	Nov 12, 2020	Reinforcement Learning (RL)	—Unverified	0
Self-supervised reinforcement learning for speaker localisation with the iCub humanoid robot	Nov 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reinforcement Learning with Videos: Combining Offline Observations with Interaction	Nov 12, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Steady State Analysis of Episodic Reinforcement Learning	Nov 12, 2020	Continual Learningreinforcement-learning	—Unverified	0
Optimizing Large-Scale Fleet Management on a Road Network using Multi-Agent Deep Reinforcement Learning with Graph Neural Network	Nov 12, 2020	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	1
Adaptive Neural Architectures for Recommender Systems	Nov 11, 2020	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
Non-local Optimization: Imposing Structure on Optimization Problems by Relaxation	Nov 11, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
pymgrid: An Open-Source Python Microgrid Simulator for Applied Artificial Intelligence Research	Nov 11, 2020	Reinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning Experiments and Benchmark for Solving Robotic Reaching Tasks	Nov 11, 2020	Positionreinforcement-learning	CodeCode Available	0
Proximal Policy Optimization via Enhanced Exploration Efficiency	Nov 11, 2020	continuous-controlContinuous Control	—Unverified	0
Offline Learning of Counterfactual Predictions for Real-World Robotic Reinforcement Learning	Nov 11, 2020	counterfactualreinforcement-learning	—Unverified	0
Reinforcement Learning with Dual-Observation for General Video Game Playing	Nov 11, 2020	Decision Makingreinforcement-learning	CodeCode Available	0
Reinforcement Learning with Time-dependent Goals for Robotic Musicians	Nov 11, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Decentralized Motion Planning for Multi-Robot Navigation using Deep Reinforcement Learning	Nov 11, 2020	Deep Reinforcement LearningMotion Planning	CodeCode Available	1
On Using Hamiltonian Monte Carlo Sampling for Reinforcement Learning Problems in High-dimension	Nov 11, 2020	Matrix CompletionQ-Learning	—Unverified	0
CRPO: A New Approach for Safe Reinforcement Learning with Convergence Guarantee	Nov 11, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Behaviorally Diverse Traffic Simulation via Reinforcement Learning	Nov 11, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 379 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified