Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9226–9250 of 15113 papers

Title	Date	Tasks	Status	Hype
Demystify Painting with RL	Dec 14, 2020	Decision MakingReinforcement Learning (RL)	—Unverified	0
Deploying Reinforcement Learning in Water Transport	Dec 14, 2020	Q-Learningreinforcement-learning	—Unverified	0
Automatic Source Code Summarization via Reinforcement Learning	Dec 14, 2020	Cloud ComputingCode Summarization	—Unverified	0
Learning Mobile Robot Navigation in the Dense Crowd with Deep Reinforcement Learning	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
A case for new neural network smoothness constraints	Dec 14, 2020	Adversarial RobustnessBIG-bench Machine Learning	—Unverified	0
Exponential Lower Bounds for Batch Reinforcement Learning: Batch RL can be Exponentially Harder than Online RL	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Visual Robotic Control Efficiently with Contrastive Pre-training and Data Augmentation	Dec 14, 2020	Data Augmentationreinforcement-learning	—Unverified	0
SAT-MARL: Specification Aware Training in Multi-Agent Reinforcement Learning	Dec 14, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Policy Gradient RL Algorithms as Directed Acyclic Graphs	Dec 14, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Sim-to-real reinforcement learning applied to end-to-end vehicle control	Dec 14, 2020	Collision Avoidancereinforcement-learning	CodeCode Available	1
Specializing Inter-Agent Communication in Heterogeneous Multi-Agent Reinforcement Learning using Agent Class Information	Dec 14, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Learning for MPC with Stability & Safety Guarantees	Dec 14, 2020	Model Predictive Controlreinforcement-learning	—Unverified	0
Active Hierarchical Imitation and Reinforcement Learning	Dec 14, 2020	Active LearningImitation Learning	—Unverified	0
A Reinforcement Learning Formulation of the Lyapunov Optimization: Application to Edge Computing Systems with Queue Stability	Dec 14, 2020	Deep Reinforcement LearningEdge-computing	—Unverified	0
Evolutionary learning of interpretable decision trees	Dec 14, 2020	Evolutionary AlgorithmsOpenAI Gym	CodeCode Available	0
Reinforcement Learning with Subspaces using Free Energy Paradigm	Dec 13, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Tutoring Reinforcement Learning via Feedback Control	Dec 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Semi-supervised reward learning for offline reinforcement learning	Dec 12, 2020	Behavioural cloningreinforcement-learning	—Unverified	0
Noise-Robust End-to-End Quantum Control using Deep Autoregressive Policy Networks	Dec 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Regularizing Action Policies for Smooth Control with Reinforcement Learning	Dec 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
OPAC: Opportunistic Actor-Critic	Dec 11, 2020	continuous-controlContinuous Control	—Unverified	0
Performance-Weighed Policy Sampling for Meta-Reinforcement Learning	Dec 10, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Blending MPC & Value Function Approximation for Efficient Reinforcement Learning	Dec 10, 2020	Model Predictive Controlreinforcement-learning	—Unverified	0
Flatland-RL : Multi-Agent Reinforcement Learning on Trains	Dec 10, 2020	Imitation LearningMulti-agent Reinforcement Learning	—Unverified	0
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 370 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified