Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10001–10050 of 15113 papers

Title	Date	Tasks	Status
Reinforcement learning with distance-based incentive/penalty (DIP) updates for highly constrained industrial control systems	Nov 22, 2020	Reinforcement Learning (RL)	—Unverified
Distributed Deep Reinforcement Learning: An Overview	Nov 22, 2020	Deep Reinforcement LearningMulti-Task Learning	—Unverified
Double Meta-Learning for Data Efficient Policy Optimization in Non-Stationary Environments	Nov 21, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
On the Convergence of Reinforcement Learning in Nonlinear Continuous State Space Problems	Nov 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Policy Teaching in Reinforcement Learning via Environment Poisoning Attacks	Nov 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
MRAC-RL: A Framework for On-Line Policy Adaptation Under Parametric Model Uncertainty	Nov 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Bridging Scene Understanding and Task Execution with Flexible Simulation Environments	Nov 20, 2020	Graph Generationreinforcement-learning	—Unverified
Model-based Reinforcement Learning for Continuous Control with Posterior Sampling	Nov 20, 2020	continuous-controlContinuous Control	CodeCode Available
Delay Constrained Buffer-Aided Relay Selection in the Internet of Things with Decision-Assisted Reinforcement Learning	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep reinforcement learning for feedback control in a collective flashing ratchet	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Energy Aware Deep Reinforcement Learning Scheduling for Sensors Correlated in Time and Space	Nov 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Parrot: Data-Driven Behavioral Priors for Reinforcement Learning	Nov 19, 2020	Decision Makingreinforcement-learning	—Unverified
Provable Multi-Objective Reinforcement Learning with Generative Models	Nov 19, 2020	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
Online Model Selection for Reinforcement Learning with Function Approximation	Nov 19, 2020	Deep Reinforcement LearningModel Selection	—Unverified
Weighted Entropy Modification for Soft Actor-Critic	Nov 18, 2020	MuJoCoreinforcement-learning	—Unverified
Indoor Point-to-Point Navigation with Deep Reinforcement Learning and Ultra-wideband	Nov 18, 2020	Autonomous NavigationDeep Reinforcement Learning	—Unverified
Inverse Reinforcement Learning via Matching of Optimality Profiles	Nov 18, 2020	reinforcement-learningReinforcement Learning	—Unverified
Experimental Study on Reinforcement Learning-based Control of an Acrobot	Nov 18, 2020	Acrobotreinforcement-learning	—Unverified
LAVA: Latent Action Spaces via Variational Auto-encoding for Dialogue Policy Optimization	Nov 18, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Counterfactual Credit Assignment in Model-Free Reinforcement Learning	Nov 18, 2020	counterfactualmodel	—Unverified
Deep Reinforcement Learning and Permissioned Blockchain for Content Caching in Vehicular Edge Computing and Networks	Nov 17, 2020	Deep Reinforcement LearningEdge-computing	—Unverified
Deep Reinforcement Learning for Stochastic Computation Offloading in Digital Twin Networks	Nov 17, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Leveraging the Variance of Return Sequences for Exploration Policy	Nov 17, 2020	Atari Gamesreinforcement-learning	—Unverified
Efficient Exploration of Reward Functions in Inverse Reinforcement Learning via Bayesian Optimization	Nov 17, 2020	Bayesian OptimizationEfficient Exploration	—Unverified
C-Learning: Learning to Achieve Goals via Recursive Classification	Nov 17, 2020	ClassificationDensity Estimation	—Unverified
Curiosity Based Reinforcement Learning on Robot Manufacturing Cell	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Explaining Conditions for Reinforcement Learning Behaviors from Real and Imagined Data	Nov 17, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Fault-Aware Robust Control via Adversarial Reinforcement Learning	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Modality-Buffet for Real-Time Object Detection	Nov 17, 2020	Decision MakingObject	—Unverified
Reinforcement Learning of Graph Neural Networks for Service Function Chaining	Nov 17, 2020	Managementreinforcement-learning	—Unverified
Multi-agent Reinforcement Learning Accelerated MCMC on Multiscale Inversion Problem	Nov 17, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
SeekNet: Improved Human Instance Segmentation and Tracking via Reinforcement Learning Based Optimized Robot Relocation	Nov 17, 2020	Human DetectionHuman Instance Segmentation	—Unverified
REALab: An Embedded Perspective on Tampering	Nov 17, 2020	Reinforcement Learning (RL)	—Unverified
PassGoodPool: Joint Passengers and Goods Fleet Management with Reinforcement Learning aided Pricing, Matching, and Route Planning	Nov 17, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Towards a General Framework for ML-based Self-tuning Databases	Nov 16, 2020	Bayesian OptimizationReinforcement Learning (RL)	—Unverified
Value Function Approximations via Kernel Embeddings for No-Regret Reinforcement Learning	Nov 16, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Learning Controllable Representations of Physical Systems	Nov 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reward Biased Maximum Likelihood Estimation for Reinforcement Learning	Nov 16, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Blind Decision Making: Reinforcement Learning with Delayed Observations	Nov 16, 2020	Decision Makingreinforcement-learning	—Unverified
Distilling a Hierarchical Policy for Planning and Control via Representation and Reinforcement Learning	Nov 16, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Constrained Model-Free Reinforcement Learning for Process Optimization	Nov 16, 2020	modelModel Predictive Control	—Unverified
ACDER: Augmented Curiosity-Driven Experience Replay	Nov 16, 2020	FetchPush-v1Reinforcement Learning (RL)	—Unverified
Analog Circuit Design with Dyna-Style Reinforcement Learning	Nov 16, 2020	Layout DesignModel-based Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Cybersecurity Assessment of Wind Integrated Power Systems	Nov 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Placement in Integrated Circuits using Cyclic Reinforcement Learning and Simulated Annealing	Nov 15, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Data-Efficient Learning for Complex and Real-Time Physical Problem Solving using Augmented Simulation	Nov 14, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified
RL-QN: A Reinforcement Learning Framework for Optimal Control of Queueing Systems	Nov 14, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified
A Geometric Perspective on Self-Supervised Policy Adaptation	Nov 14, 2020	Reinforcement Learning (RL)	—Unverified
Active Reinforcement Learning: Observing Rewards at a Cost	Nov 13, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Critic PI2: Master Continuous Planning via Policy Improvement with Path Integrals and Deep Actor-Critic Reinforcement Learning	Nov 13, 2020	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 201 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified