Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10001–10025 of 15113 papers

Title	Date	Tasks	Status
Reinforcement learning with distance-based incentive/penalty (DIP) updates for highly constrained industrial control systems	Nov 22, 2020	Reinforcement Learning (RL)	—Unverified
Distributed Deep Reinforcement Learning: An Overview	Nov 22, 2020	Deep Reinforcement LearningMulti-Task Learning	—Unverified
Double Meta-Learning for Data Efficient Policy Optimization in Non-Stationary Environments	Nov 21, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
On the Convergence of Reinforcement Learning in Nonlinear Continuous State Space Problems	Nov 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Policy Teaching in Reinforcement Learning via Environment Poisoning Attacks	Nov 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
MRAC-RL: A Framework for On-Line Policy Adaptation Under Parametric Model Uncertainty	Nov 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Bridging Scene Understanding and Task Execution with Flexible Simulation Environments	Nov 20, 2020	Graph Generationreinforcement-learning	—Unverified
Model-based Reinforcement Learning for Continuous Control with Posterior Sampling	Nov 20, 2020	continuous-controlContinuous Control	CodeCode Available
Delay Constrained Buffer-Aided Relay Selection in the Internet of Things with Decision-Assisted Reinforcement Learning	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep reinforcement learning for feedback control in a collective flashing ratchet	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Energy Aware Deep Reinforcement Learning Scheduling for Sensors Correlated in Time and Space	Nov 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Parrot: Data-Driven Behavioral Priors for Reinforcement Learning	Nov 19, 2020	Decision Makingreinforcement-learning	—Unverified
Provable Multi-Objective Reinforcement Learning with Generative Models	Nov 19, 2020	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
Online Model Selection for Reinforcement Learning with Function Approximation	Nov 19, 2020	Deep Reinforcement LearningModel Selection	—Unverified
Weighted Entropy Modification for Soft Actor-Critic	Nov 18, 2020	MuJoCoreinforcement-learning	—Unverified
Indoor Point-to-Point Navigation with Deep Reinforcement Learning and Ultra-wideband	Nov 18, 2020	Autonomous NavigationDeep Reinforcement Learning	—Unverified
Inverse Reinforcement Learning via Matching of Optimality Profiles	Nov 18, 2020	reinforcement-learningReinforcement Learning	—Unverified
Experimental Study on Reinforcement Learning-based Control of an Acrobot	Nov 18, 2020	Acrobotreinforcement-learning	—Unverified
LAVA: Latent Action Spaces via Variational Auto-encoding for Dialogue Policy Optimization	Nov 18, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Counterfactual Credit Assignment in Model-Free Reinforcement Learning	Nov 18, 2020	counterfactualmodel	—Unverified
Deep Reinforcement Learning and Permissioned Blockchain for Content Caching in Vehicular Edge Computing and Networks	Nov 17, 2020	Deep Reinforcement LearningEdge-computing	—Unverified
Deep Reinforcement Learning for Stochastic Computation Offloading in Digital Twin Networks	Nov 17, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Leveraging the Variance of Return Sequences for Exploration Policy	Nov 17, 2020	Atari Gamesreinforcement-learning	—Unverified
Efficient Exploration of Reward Functions in Inverse Reinforcement Learning via Bayesian Optimization	Nov 17, 2020	Bayesian OptimizationEfficient Exploration	—Unverified
C-Learning: Learning to Achieve Goals via Recursive Classification	Nov 17, 2020	ClassificationDensity Estimation	—Unverified

Show:10 25 50

← PrevPage 401 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified