Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10051–10075 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning of Transition States	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Quadruped Jumping via Deep Reinforcement Learning	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Scaffolding Reflection in Reinforcement Learning Framework for Confinement Escape Problem	Nov 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Control of a Biomechanical Model of the Upper Extremity	Nov 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Phoebe: Reuse-Aware Online Caching with Reinforcement Learning for Emerging Storage Models	Nov 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning Control of Constrained Dynamic Systems with Uniformly Ultimate Boundedness Stability Guarantee	Nov 13, 2020	continuous-controlContinuous Control	—Unverified
Robotic self-representation improves manipulation skills and transfer learning	Nov 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Query-based Targeted Action-Space Adversarial Policies on Deep Reinforcement Learning Agents	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Self-supervised reinforcement learning for speaker localisation with the iCub humanoid robot	Nov 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Steady State Analysis of Episodic Reinforcement Learning	Nov 12, 2020	Continual Learningreinforcement-learning	—Unverified
A Review of Uncertainty Quantification in Deep Learning: Techniques, Applications and Challenges	Nov 12, 2020	Decision MakingEnsemble Learning	—Unverified
Imposing Robust Structured Control Constraint on Reinforcement Learning of Linear Quadratic Regulator	Nov 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical reinforcement learning for efficient exploration and transfer	Nov 12, 2020	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified
Griddly: A platform for AI research in games	Nov 12, 2020	Reinforcement Learning (RL)	—Unverified
Adaptive Neural Architectures for Recommender Systems	Nov 11, 2020	Deep Reinforcement LearningRecommendation Systems	—Unverified
On Using Hamiltonian Monte Carlo Sampling for Reinforcement Learning Problems in High-dimension	Nov 11, 2020	Matrix CompletionQ-Learning	—Unverified
CRPO: A New Approach for Safe Reinforcement Learning with Convergence Guarantee	Nov 11, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Behaviorally Diverse Traffic Simulation via Reinforcement Learning	Nov 11, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Proximal Policy Optimization via Enhanced Exploration Efficiency	Nov 11, 2020	continuous-controlContinuous Control	—Unverified
Reinforcement Learning with Dual-Observation for General Video Game Playing	Nov 11, 2020	Decision Makingreinforcement-learning	CodeCode Available
Non-local Optimization: Imposing Structure on Optimization Problems by Relaxation	Nov 11, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning with Time-dependent Goals for Robotic Musicians	Nov 11, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Experiments and Benchmark for Solving Robotic Reaching Tasks	Nov 11, 2020	Positionreinforcement-learning	CodeCode Available
Offline Learning of Counterfactual Predictions for Real-World Robotic Reinforcement Learning	Nov 11, 2020	counterfactualreinforcement-learning	—Unverified
Sample Complexity Bounds for Two Timescale Value-based Reinforcement Learning Algorithms	Nov 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 403 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified