Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9351–9400 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning for Robust Missile Autopilot Design	Nov 26, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
An End-to-end Deep Reinforcement Learning Approach for the Long-term Short-term Planning on the Frenet Space	Nov 26, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Exploring grid topology reconfiguration using a simple deep reinforcement learning approach	Nov 26, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning from Simulation, Racing in Reality	Nov 26, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Interactive Machine Learning of Musical Gesture	Nov 26, 2020	BIG-bench Machine LearningReinforcement Learning (RL)	CodeCode Available	1
Generalization in Reinforcement Learning by Soft Data Augmentation	Nov 26, 2020	Data Augmentationreinforcement-learning	CodeCode Available	1
MetaSensing: Intelligent Metasurface Assisted RF 3D Sensing by Deep Reinforcement Learning	Nov 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Diluted Near-Optimal Expert Demonstrations for Guiding Dialogue Stochastic Policy Optimisation	Nov 25, 2020	Imitation LearningQ-Learning	—Unverified	0
Accommodating Picky Customers: Regret Bound and Exploration Complexity for Multi-Objective Reinforcement Learning	Nov 25, 2020	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available	0
Auto Graph Encoder-Decoder for Neural Network Pruning	Nov 25, 2020	DecoderModel Compression	—Unverified	0
Combining Semantic Guidance and Deep Reinforcement Learning For Generating Human Level Paintings	Nov 25, 2020	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
RLlib Flow: Distributed Reinforcement Learning is a Dataflow Problem	Nov 25, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	4
TLeague: A Framework for Competitive Self-Play based Distributed Multi-Agent Reinforcement Learning	Nov 25, 2020	Dota 2Multi-agent Reinforcement Learning	CodeCode Available	1
Symmetry-Aware Actor-Critic for 3D Molecular Design	Nov 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Towards Playing Full MOBA Games with Deep Reinforcement Learning	Nov 25, 2020	AI AgentDeep Reinforcement Learning	—Unverified	0
World Model as a Graph: Learning Latent Landmarks for Planning	Nov 25, 2020	continuous-controlContinuous Control	CodeCode Available	1
PowerNet: Multi-agent Deep Reinforcement Learning for Scalable Powergrid Control	Nov 24, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
REPAINT: Knowledge Transfer in Deep Reinforcement Learning	Nov 24, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Solving The Lunar Lander Problem under Uncertainty using Reinforcement Learning	Nov 24, 2020	NavigateQ-Learning	CodeCode Available	0
Learning Principle of Least Action with Reinforcement Learning	Nov 24, 2020	Q-Learningreinforcement-learning	CodeCode Available	0
A Reusable Framework Based on Reinforcement Learning to Design Antennas for Curved Surfaces	Nov 24, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Uncertainty Estimation and Calibration with Finite-State Probabilistic RNNs	Nov 24, 2020	Out-of-Distribution Detectionreinforcement-learning	—Unverified	0
Path Design and Resource Management for NOMA enhanced Indoor Intelligent Robots	Nov 23, 2020	Managementreinforcement-learning	—Unverified	0
Logarithmic Regret for Reinforcement Learning with Linear Function Approximation	Nov 23, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Consolidation via Policy Information Regularization in Deep RL for Multi-Agent Games	Nov 23, 2020	Continual Learningcontinuous-control	—Unverified	0
An Empirical Study of Representation Learning for Reinforcement Learning in Healthcare	Nov 23, 2020	Open-Ended Question Answeringreinforcement-learning	CodeCode Available	1
Evolutionary Planning in Latent Space	Nov 23, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
COCOI: Contact-aware Online Context Inference for Generalizable Non-planar Pushing	Nov 23, 2020	Contact-rich ManipulationDeep Reinforcement Learning	—Unverified	0
An analysis of Reinforcement Learning applied to Coach task in IEEE Very Small Size Soccer	Nov 23, 2020	Reinforcement Learning (RL)	CodeCode Available	0
Generative Adversarial Simulator	Nov 23, 2020	Data-free Knowledge DistillationKnowledge Distillation	—Unverified	0
Distributed Deep Reinforcement Learning: An Overview	Nov 22, 2020	Deep Reinforcement LearningMulti-Task Learning	—Unverified	0
Reinforcement learning with distance-based incentive/penalty (DIP) updates for highly constrained industrial control systems	Nov 22, 2020	Reinforcement Learning (RL)	—Unverified	0
Policy Teaching in Reinforcement Learning via Environment Poisoning Attacks	Nov 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
On the Convergence of Reinforcement Learning in Nonlinear Continuous State Space Problems	Nov 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Double Meta-Learning for Data Efficient Policy Optimization in Non-Stationary Environments	Nov 21, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Delay Constrained Buffer-Aided Relay Selection in the Internet of Things with Decision-Assisted Reinforcement Learning	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Model-based Reinforcement Learning for Continuous Control with Posterior Sampling	Nov 20, 2020	continuous-controlContinuous Control	CodeCode Available	0
Revisiting Rainbow: Promoting more Insightful and Inclusive Deep Reinforcement Learning Research	Nov 20, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
MRAC-RL: A Framework for On-Line Policy Adaptation Under Parametric Model Uncertainty	Nov 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep reinforcement learning for feedback control in a collective flashing ratchet	Nov 20, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Bridging Scene Understanding and Task Execution with Flexible Simulation Environments	Nov 20, 2020	Graph Generationreinforcement-learning	—Unverified	0
Provable Multi-Objective Reinforcement Learning with Generative Models	Nov 19, 2020	Multi-Objective Reinforcement LearningQ-Learning	—Unverified	0
Online Model Selection for Reinforcement Learning with Function Approximation	Nov 19, 2020	Deep Reinforcement LearningModel Selection	—Unverified	0
Parrot: Data-Driven Behavioral Priors for Reinforcement Learning	Nov 19, 2020	Decision Makingreinforcement-learning	—Unverified	0
Energy Aware Deep Reinforcement Learning Scheduling for Sensors Correlated in Time and Space	Nov 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
FinRL: A Deep Reinforcement Learning Library for Automated Stock Trading in Quantitative Finance	Nov 19, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	3
Inverse Constrained Reinforcement Learning	Nov 19, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Is Independent Learning All You Need in the StarCraft Multi-Agent Challenge?	Nov 18, 2020	AllMulti-agent Reinforcement Learning	CodeCode Available	1
Inverse Reinforcement Learning via Matching of Optimality Profiles	Nov 18, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Experimental Study on Reinforcement Learning-based Control of an Acrobot	Nov 18, 2020	Acrobotreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 188 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified