Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11551–11600 of 15113 papers

Title	Date	Tasks	Status	Hype
IKEA Furniture Assembly Environment for Long-Horizon Complex Manipulation Tasks	Nov 17, 2019	Industrial Robotsreinforcement-learning	CodeCode Available	0
Hebbian Synaptic Modifications in Spiking Neurons that Learn	Nov 17, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Inverse Reinforcement Learning with Missing Data	Nov 16, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Generalized Maximum Causal Entropy for Inverse Reinforcement Learning	Nov 16, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Off-Policy Policy Gradient Algorithms by Constraining the State Distribution Shift	Nov 16, 2019	continuous-controlContinuous Control	—Unverified	0
Missingness as Stability: Understanding the Structure of Missingness in Longitudinal EHR data and its Impact on Reinforcement Learning in Healthcare	Nov 16, 2019	Imputationreinforcement-learning	CodeCode Available	0
Reinforcement Learning from Imperfect Demonstrations under Soft Expert Guidance	Nov 16, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Empirical Study of Off-Policy Policy Evaluation for Reinforcement Learning	Nov 15, 2019	BenchmarkingDiversity	CodeCode Available	0
Improved Exploration through Latent Trajectory Optimization in Deep Deterministic Policy Gradient	Nov 15, 2019	continuous-controlContinuous Control	—Unverified	0
Data-efficient Co-Adaptation of Morphology and Behaviour with Deep Reinforcement Learning	Nov 15, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Adaptive Traffic Signal Control	Nov 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Reduction from Reinforcement Learning to No-Regret Online Learning	Nov 14, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Gamifying the Vehicle Routing Problem with Stochastic Requests	Nov 14, 2019	Atari GamesDecision Making	—Unverified	0
Reinforcement Learning for Market Making in a Multi-agent Dealer Market	Nov 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Asymptotics of Reinforcement Learning with Neural Networks	Nov 13, 2019	Q-Learningreinforcement-learning	—Unverified	0
Kinematic State Abstraction and Provably Efficient Rich-Observation Reinforcement Learning	Nov 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Convergent Off-Policy Temporal Difference Algorithm	Nov 13, 2019	PredictionReinforcement Learning	CodeCode Available	0
Learning to Communicate in Multi-Agent Reinforcement Learning : A Review	Nov 13, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Buffer-aware Wireless Scheduling based on Deep Reinforcement Learning	Nov 13, 2019	Deep Reinforcement LearningFairness	—Unverified	0
Reinforcement Learning-Driven Test Generation for Android GUI Applications using Formal Specifications	Nov 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
One-shot learning and behavioral eligibility traces in sequential decision making	Nov 12, 2019	Decision MakingLearning Theory	—Unverified	0
Schedule Earth Observation satellites with Deep Reinforcement Learning	Nov 12, 2019	Deep Reinforcement LearningEarth Observation	—Unverified	0
MSDF: A Deep Reinforcement Learning Framework for Service Function Chain Migration	Nov 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Planning under Partial Observability with Unnormalized Q Functions and Spectral Learning	Nov 12, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Accelerating Training in Pommerman with Imitation and Reinforcement Learning	Nov 12, 2019	Imitation Learningreinforcement-learning	—Unverified	0
Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning	Nov 12, 2019	Combinatorial OptimizationGraph Embedding	CodeCode Available	1
Reinforcement-Learning-Based Variational Quantum Circuits Optimization for Combinatorial Problems	Nov 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
SMIX(λ): Enhancing Centralized Value Functions for Cooperative Multi-Agent Reinforcement Learning	Nov 11, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Multi-Agent Connected Autonomous Driving using Deep Reinforcement Learning	Nov 11, 2019	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	0
Real-Time Reinforcement Learning	Nov 11, 2019	continuous-controlContinuous Control	CodeCode Available	0
Driving Reinforcement Learning with Models	Nov 11, 2019	Model Predictive Controlreinforcement-learning	CodeCode Available	0
Context-aware Active Multi-Step Reinforcement Learning	Nov 11, 2019	Active LearningDecision Making	—Unverified	0
DRiLLS: Deep Reinforcement Learning for Logic Synthesis	Nov 11, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning to Order Sub-questions for Complex Question Answering	Nov 11, 2019	Question AnsweringReinforcement Learning	—Unverified	0
Value-Added Chemical Discovery Using Reinforcement Learning	Nov 10, 2019	Computational chemistryDeep Reinforcement Learning	—Unverified	0
Minimalistic Attacks: How Little it Takes to Fool a Deep Reinforcement Learning Policy	Nov 10, 2019	Adversarial AttackAtari Games	—Unverified	0
Deep Reinforcement Learning Based Dynamic Trajectory Control for UAV-assisted Mobile Edge Computing	Nov 10, 2019	Deep Reinforcement LearningEdge-computing	—Unverified	0
Model-Based Reinforcement Learning with Adversarial Training for Online Recommendation	Nov 10, 2019	Generative Adversarial NetworkModel-based Reinforcement Learning	CodeCode Available	0
Hierarchical Reinforcement Learning Method for Autonomous Vehicle Behavior Planning	Nov 9, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to reinforcement learn for Neural Architecture Search	Nov 9, 2019	Meta-LearningNeural Architecture Search	CodeCode Available	0
Worst Cases Policy Gradients	Nov 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Contrastive Multi-document Question Generation	Nov 8, 2019	Contrastive LearningQuestion Generation	CodeCode Available	0
Fully Bayesian Recurrent Neural Networks for Safe Reinforcement Learning	Nov 8, 2019	Collision Avoidancereinforcement-learning	—Unverified	0
H_ Model-free Reinforcement Learning with Robust Stability Guarantee	Nov 7, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available	0
Option Compatible Reward Inverse Reinforcement Learning	Nov 7, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Optimizing the Factual Correctness of a Summary: A Study of Summarizing Radiology Reports	Nov 6, 2019	Abstractive Text SummarizationFact Checking	—Unverified	0
MBCAL: Sample Efficient and Variance Reduced Reinforcement Learning for Recommender Systems	Nov 6, 2019	counterfactualDeep Reinforcement Learning	—Unverified	0
Experience Sharing Between Cooperative Reinforcement Learning Agents	Nov 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Reward Decomposition for Reinforcement Learning	Nov 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Improving reinforcement learning algorithms: towards optimal learning rate policies	Nov 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 232 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified