Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12551–12600 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep reinforcement learning for scheduling in large-scale networked control systems	May 15, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Expressive Priors in Bayesian Neural Networks: Kernel Combinations and Periodic Functions	May 15, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement Learning for Robotics and Control with Active Uncertainty Reduction	May 15, 2019	ManagementOpenAI Gym	—Unverified	0
Meta reinforcement learning as task inference	May 15, 2019	continuous-controlContinuous Control	CodeCode Available	0
QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning	May 14, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
TauRieL: Targeting Traveling Salesman Problem with a deep reinforcement learning inspired architecture	May 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Trajectory-Based Off-Policy Deep Reinforcement Learning	May 14, 2019	continuous-controlContinuous Control	CodeCode Available	0
Successor Options: An Option Discovery Framework for Reinforcement Learning	May 14, 2019	Navigatereinforcement-learning	CodeCode Available	0
Variational Regret Bounds for Reinforcement Learning	May 14, 2019	General Reinforcement Learningreinforcement-learning	—Unverified	0
Combining Parametric and Nonparametric Models for Off-Policy Evaluation	May 14, 2019	Mixture-of-ExpertsOff-policy evaluation	—Unverified	0
Control Regularization for Reduced Variance Reinforcement Learning	May 14, 2019	continuous-controlContinuous Control	CodeCode Available	0
Deep Multi-Agent Reinforcement Learning Based Cooperative Edge Caching in Wireless Networks	May 13, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Reinforcement Learning for Efficient Exploration	May 13, 2019	Atari GamesDistributional Reinforcement Learning	—Unverified	0
Learning and Exploiting Multiple Subgoals for Fast Exploration in Hierarchical Reinforcement Learning	May 13, 2019	Hierarchical Reinforcement LearningMontezuma's Revenge	—Unverified	0
CityFlow: A Multi-Agent Reinforcement Learning Environment for Large Scale City Traffic Scenario	May 13, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Task-Agnostic Dynamics Priors for Deep Reinforcement Learning	May 13, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Multi-Agent Image Classification via Reinforcement Learning	May 13, 2019	ClassificationGeneral Classification	CodeCode Available	0
Metareasoning in Modular Software Systems: On-the-Fly Configuration using Reinforcement Learning with Rich Contextual Representations	May 12, 2019	Decision Makingreinforcement-learning	—Unverified	0
Learning Phase Competition for Traffic Signal Control	May 12, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Diagnosing Reinforcement Learning for Traffic Signal Control	May 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Graph Attention Memory for Visual Navigation	May 11, 2019	Deep Reinforcement LearningGraph Attention	—Unverified	0
Optimizing Routerless Network-on-Chip Designs: An Innovative Learning-Based Framework	May 11, 2019	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Intelligent User Association for Symbiotic Radio Networks using Deep Reinforcement Learning	May 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Domain Adversarial Reinforcement Learning for Partial Domain Adaptation	May 10, 2019	Domain AdaptationPartial Domain Adaptation	—Unverified	0
Attention-based Deep Reinforcement Learning for Multi-view Environments	May 10, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Do Autonomous Agents Benefit from Hearing?	May 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Autonomous Management of Energy-Harvesting IoT Nodes Using Deep Reinforcement Learning	May 10, 2019	Deep Reinforcement LearningManagement	CodeCode Available	0
Emergent Escape-based Flocking Behavior using Multi-Agent Reinforcement Learning	May 10, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Design of Artificial Intelligence Agents for Games using Deep Reinforcement Learning	May 10, 2019	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
GAN-powered Deep Distributional Reinforcement Learning for Resource Management in Network Slicing	May 10, 2019	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified	0
On the Detection of Mutual Influences and Their Consideration in Reinforcement Learning Processes	May 10, 2019	3D Reconstructionreinforcement-learning	—Unverified	0
Multi-Pass Q-Networks for Deep Reinforcement Learning with Parameterised Action Spaces	May 10, 2019	Control with Prametrised ActionsDeep Reinforcement Learning	CodeCode Available	0
Reinforcement Learning in Non-Stationary Environments	May 10, 2019	energy managementManagement	—Unverified	0
Toward Packet Routing with Fully-distributed Multi-agent Deep Reinforcement Learning	May 9, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
A Reinforcement Learning Perspective on the Optimal Control of Mutation Probabilities for the (1+1) Evolutionary Algorithm: First Results on the OneMax Problem	May 9, 2019	Evolutionary AlgorithmsQ-Learning	—Unverified	0
Path Design for Cellular-Connected UAV with Reinforcement Learning	May 9, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Pretrain Soft Q-Learning with Imperfect Demonstrations	May 9, 2019	Q-Learningreinforcement-learning	—Unverified	0
Learning to Evolve	May 8, 2019	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available	0
Longitudinal Dynamic versus Kinematic Models for Car-Following Control Using Deep Reinforcement Learning	May 7, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Accelerated Target Updates for Q-learning	May 7, 2019	Atari GamesQ-Learning	—Unverified	0
Toybox: A Suite of Environments for Experimental Evaluation of Deep Reinforcement Learning	May 7, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Object Exchangeability in Reinforcement Learning: Extended Abstract	May 7, 2019	Deep Reinforcement LearningObject	—Unverified	0
Reinforced Genetic Algorithm Learning for Optimizing Computation Graphs	May 7, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Continual and Multi-task Reinforcement Learning With Shared Episodic Memory	May 7, 2019	Continual Learningreinforcement-learning	—Unverified	0
A Complementary Learning Systems Approach to Temporal Difference Learning	May 7, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Dimension-Wise Importance Sampling Weight Clipping for Sample-Efficient Reinforcement Learning	May 7, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Combining Planning and Deep Reinforcement Learning in Tactical Decision Making for Autonomous Driving	May 6, 2019	Autonomous DrivingDecision Making	—Unverified	0
Deep Ordinal Reinforcement Learning	May 6, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	0
Learning to Control in Metric Space with Optimal Regret	May 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
P3O: Policy-on Policy-off Policy Optimization	May 5, 2019	MuJoCoReinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 252 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified