Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11251–11275 of 15113 papers

Title	Date	Tasks	Status
Safe Reinforcement Learning for Autonomous Vehicles through Parallel Constrained Policy Optimization	Mar 3, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
Relevance-Guided Modeling of Object Dynamics for Reinforcement Learning	Mar 3, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Learning Context-aware Task Reasoning for Efficient Meta-reinforcement Learning	Mar 3, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Efficient Exploration in Constrained Environments with Goal-Oriented Reference Path	Mar 3, 2020	Efficient ExplorationNavigate	—Unverified
Deep Reinforcement Learning for QoS-Constrained Resource Allocation in Multiservice Networks	Mar 3, 2020	Deep Reinforcement LearningDistributed Optimization	—Unverified
Cluster-Based Social Reinforcement Learning	Mar 2, 2020	ClusteringMarketing	—Unverified
Adaptive Structural Hyper-Parameter Configuration by Q-Learning	Mar 2, 2020	Evolutionary AlgorithmsQ-Learning	—Unverified
Formal Controller Synthesis for Continuous-Space MDPs via Model-Free Reinforcement Learning	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Gaussian Process Policy Optimization	Mar 2, 2020	MuJoCoreinforcement-learning	—Unverified
Learning Force Control for Contact-rich Manipulation Tasks with Rigid Position-controlled Robots	Mar 2, 2020	Contact-rich ManipulationPosition	—Unverified
Scaling Up Multiagent Reinforcement Learning for Robotic Systems: Learn an Adaptive Sparse Communication Graph	Mar 2, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dynamic Queue-Jump Lane for Emergency Vehicles under Partially Connected Settings: A Multi-Agent Deep Reinforcement Learning Approach	Mar 2, 2020	BlockingDeep Reinforcement Learning	—Unverified
Real-World Human-Robot Collaborative Reinforcement Learning	Mar 2, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Risk-Averse Learning by Temporal Difference Methods	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Upper Confidence Primal-Dual Reinforcement Learning for CMDP with Adversarial Loss	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Hybrid Stochastic Policy Gradient Algorithm for Reinforcement Learning	Mar 1, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Fully Asynchronous Policy Evaluation in Distributed Reinforcement Learning over Networks	Mar 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Near Optimal Policies with Low Inherent Bellman Error	Feb 29, 2020	reinforcement-learningReinforcement Learning	—Unverified
Contextual Policy Transfer in Reinforcement Learning Domains via Deep Mixtures-of-Experts	Feb 29, 2020	Mixture-of-ExpertsOpenAI Gym	—Unverified
TAdam: A Robust Stochastic Gradient Optimizer	Feb 29, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
A Self-Tuning Actor-Critic Algorithm	Feb 28, 2020	Atari Gamesreinforcement-learning	—Unverified
Deep Reinforcement Learning for FlipIt Security Game	Feb 28, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Mixed Reinforcement Learning with Additive Stochastic Uncertainty	Feb 28, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning through Active Inference	Feb 28, 2020	Decision Makingreinforcement-learning	—Unverified
On Catastrophic Interference in Atari 2600 Games	Feb 28, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 451 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified