Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11076–11100 of 15113 papers

Title	Date	Tasks	Status
Almost Optimal Model-Free Reinforcement Learning via Reference-Advantage Decomposition	Apr 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning as Reinforcement: Applying Principles of Neuroscience for More General Reinforcement Learning Agents	Apr 20, 2020	Decision MakingGeneral Reinforcement Learning	—Unverified
Data-Driven Learning and Load Ensemble Control	Apr 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Attention Routing: track-assignment detailed routing using attention-based reinforcement learning	Apr 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Tightening Exploration in Upper Confidence Reinforcement Learning	Apr 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Self-Guided Evolution Strategies with Historical Estimated Gradients	Apr 20, 2020	Reinforcement Learning (RL)	CodeCode Available
Superkernel Neural Architecture Search for Image Denoising	Apr 19, 2020	DenoisingGPU	—Unverified
Variational Policy Propagation for Multi-agent Reinforcement Learning	Apr 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Macro-Action-Based Deep Multi-Agent Reinforcement Learning	Apr 18, 2020	Decision MakingDecision Making Under Uncertainty	—Unverified
Time Adaptive Reinforcement Learning	Apr 18, 2020	reinforcement-learningReinforcement Learning	—Unverified
Modeling Survival in model-based Reinforcement Learning	Apr 18, 2020	Decision Makingmodel	—Unverified
Show Us the Way: Learning to Manage Dialog from Demonstrations	Apr 17, 2020	dialog state trackingManagement	—Unverified
F2A2: Flexible Fully-decentralized Approximate Actor-critic for Cooperative Multi-agent Reinforcement Learning	Apr 17, 2020	Multi-agent Reinforcement LearningReinforcement Learning	—Unverified
Knowledge-guided Deep Reinforcement Learning for Interactive Recommendation	Apr 17, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Adaptive Learning Systems	Apr 17, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Approximate Inverse Reinforcement Learning from Vision-based Imitation Learning	Apr 17, 2020	Autonomous DrivingImitation Learning	—Unverified
Goal-conditioned Batch Reinforcement Learning for Rotation Invariant Locomotion	Apr 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Data-Driven Robust Control Using Reinforcement Learning	Apr 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Game Theoretic Framework for Model Based Reinforcement Learning	Apr 16, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Analyzing Reinforcement Learning Benchmarks with Random Weight Guessing	Apr 16, 2020	OpenAI Gymreinforcement-learning	CodeCode Available
OptiGAN: Generative Adversarial Networks for Goal Optimized Sequence Generation	Apr 16, 2020	Diversityreinforcement-learning	CodeCode Available
Reinforcement Learning for Safety-Critical Control under Model Uncertainty, using Control Lyapunov Functions and Control Barrier Functions	Apr 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in a Physics-Inspired Semi-Markov Environment	Apr 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Safe deep reinforcement learning-based constrained optimal control scheme for active distribution networks	Apr 15, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving Input-Output Linearizing Controllers for Bipedal Robots via Reinforcement Learning	Apr 15, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 444 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified