Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11751–11800 of 15113 papers

Title	Date	Tasks	Status
Gamifying the Vehicle Routing Problem with Stochastic Requests	Nov 14, 2019	Atari GamesDecision Making	—Unverified
Deep Reinforcement Learning for Adaptive Traffic Signal Control	Nov 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Reduction from Reinforcement Learning to No-Regret Online Learning	Nov 14, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Market Making in a Multi-agent Dealer Market	Nov 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning-Driven Test Generation for Android GUI Applications using Formal Specifications	Nov 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Convergent Off-Policy Temporal Difference Algorithm	Nov 13, 2019	PredictionReinforcement Learning	CodeCode Available
Kinematic State Abstraction and Provably Efficient Rich-Observation Reinforcement Learning	Nov 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
Buffer-aware Wireless Scheduling based on Deep Reinforcement Learning	Nov 13, 2019	Deep Reinforcement LearningFairness	—Unverified
Learning to Communicate in Multi-Agent Reinforcement Learning : A Review	Nov 13, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Asymptotics of Reinforcement Learning with Neural Networks	Nov 13, 2019	Q-Learningreinforcement-learning	—Unverified
Efficient Planning under Partial Observability with Unnormalized Q Functions and Spectral Learning	Nov 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Accelerating Training in Pommerman with Imitation and Reinforcement Learning	Nov 12, 2019	Imitation Learningreinforcement-learning	—Unverified
One-shot learning and behavioral eligibility traces in sequential decision making	Nov 12, 2019	Decision MakingLearning Theory	—Unverified
Schedule Earth Observation satellites with Deep Reinforcement Learning	Nov 12, 2019	Deep Reinforcement LearningEarth Observation	—Unverified
MSDF: A Deep Reinforcement Learning Framework for Service Function Chain Migration	Nov 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Real-Time Reinforcement Learning	Nov 11, 2019	continuous-controlContinuous Control	CodeCode Available
Multi-Agent Connected Autonomous Driving using Deep Reinforcement Learning	Nov 11, 2019	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available
Reinforcement-Learning-Based Variational Quantum Circuits Optimization for Combinatorial Problems	Nov 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
SMIX(λ): Enhancing Centralized Value Functions for Cooperative Multi-Agent Reinforcement Learning	Nov 11, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
DRiLLS: Deep Reinforcement Learning for Logic Synthesis	Nov 11, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Driving Reinforcement Learning with Models	Nov 11, 2019	Model Predictive Controlreinforcement-learning	CodeCode Available
Learning to Order Sub-questions for Complex Question Answering	Nov 11, 2019	Question AnsweringReinforcement Learning	—Unverified
Context-aware Active Multi-Step Reinforcement Learning	Nov 11, 2019	Active LearningDecision Making	—Unverified
Model-Based Reinforcement Learning with Adversarial Training for Online Recommendation	Nov 10, 2019	Generative Adversarial NetworkModel-based Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning Based Dynamic Trajectory Control for UAV-assisted Mobile Edge Computing	Nov 10, 2019	Deep Reinforcement LearningEdge-computing	—Unverified
Value-Added Chemical Discovery Using Reinforcement Learning	Nov 10, 2019	Computational chemistryDeep Reinforcement Learning	—Unverified
Minimalistic Attacks: How Little it Takes to Fool a Deep Reinforcement Learning Policy	Nov 10, 2019	Adversarial AttackAtari Games	—Unverified
Worst Cases Policy Gradients	Nov 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hierarchical Reinforcement Learning Method for Autonomous Vehicle Behavior Planning	Nov 9, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Learning to reinforcement learn for Neural Architecture Search	Nov 9, 2019	Meta-LearningNeural Architecture Search	CodeCode Available
Fully Bayesian Recurrent Neural Networks for Safe Reinforcement Learning	Nov 8, 2019	Collision Avoidancereinforcement-learning	—Unverified
Contrastive Multi-document Question Generation	Nov 8, 2019	Contrastive LearningQuestion Generation	CodeCode Available
Option Compatible Reward Inverse Reinforcement Learning	Nov 7, 2019	reinforcement-learningReinforcement Learning	—Unverified
H_ Model-free Reinforcement Learning with Robust Stability Guarantee	Nov 7, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available
Experience Sharing Between Cooperative Reinforcement Learning Agents	Nov 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Distributional Reward Decomposition for Reinforcement Learning	Nov 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Improving reinforcement learning algorithms: towards optimal learning rate policies	Nov 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Optimizing the Factual Correctness of a Summary: A Study of Summarizing Radiology Reports	Nov 6, 2019	Abstractive Text SummarizationFact Checking	—Unverified
MBCAL: Sample Efficient and Variance Reduced Reinforcement Learning for Recommender Systems	Nov 6, 2019	counterfactualDeep Reinforcement Learning	—Unverified
Quinoa: a Q-function You Infer Normalized Over Actions	Nov 5, 2019	Normalising Flowsreinforcement-learning	—Unverified
Robo-advising: Learning Investors' Risk Preferences via Portfolio Choices	Nov 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Gym-Ignition: Reproducible Robotic Simulations for Reinforcement Learning	Nov 5, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
DeepRacer: Educational Autonomous Racing Platform for Experimentation with Sim2Real Reinforcement Learning	Nov 5, 2019	Autonomous RacingDeep Reinforcement Learning	—Unverified
Fully Parameterized Quantile Function for Distributional Reinforcement Learning	Nov 5, 2019	Atari GamesDistributional Reinforcement Learning	CodeCode Available
An End-to-End Deep RL Framework for Task Arrangement in Crowdsourcing Platforms	Nov 4, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
Robotic Tracking Control with Kernel Trick-based Reinforcement Learning	Nov 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
Problem Dependent Reinforcement Learning Bounds Which Can Identify Bandit Structure in MDPs	Nov 3, 2019	Multi-Armed Banditsreinforcement-learning	—Unverified
Online Robustness Training for Deep Reinforcement Learning	Nov 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Maximum Entropy Diverse Exploration: Disentangling Maximum Entropy Reinforcement Learning	Nov 3, 2019	Diversityreinforcement-learning	—Unverified
Non-Cooperative Inverse Reinforcement Learning	Nov 3, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 236 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified