Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11701–11750 of 15113 papers

Title	Date	Tasks	Status
Which Channel to Ask My Question? Personalized Customer Service RequestStream Routing using DeepReinforcement Learning	Nov 24, 2019	ChatbotDeep Reinforcement Learning	—Unverified
Scaling active inference	Nov 24, 2019	Efficient ExplorationReinforcement Learning	—Unverified
Corpus-Level End-to-End Exploration for Interactive Systems	Nov 23, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Dynamic Control of a Fiber Manufacturing Process using Deep Reinforcement Learning	Nov 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Iteratively-Refined Interactive 3D Medical Image Segmentation with Multi-Agent Reinforcement Learning	Nov 23, 2019	Image SegmentationMedical Image Segmentation	—Unverified
From Persistent Homology to Reinforcement Learning with Applications for Retail Banking	Nov 23, 2019	Managementreinforcement-learning	—Unverified
Fleet Control using Coregionalized Gaussian Process Policy Iteration	Nov 22, 2019	Gaussian Processesreinforcement-learning	CodeCode Available
Analysis of Evolutionary Behavior in Self-Learning Media Search Engines	Nov 22, 2019	Diversityreinforcement-learning	—Unverified
Graph Pruning for Model Compression	Nov 22, 2019	AutoMLmodel	—Unverified
Deep Reinforcement Learning for Trading	Nov 22, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
DeepSynth: Automata Synthesis for Automatic Task Segmentation in Deep Reinforcement Learning	Nov 22, 2019	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available
Information-Theoretic Confidence Bounds for Reinforcement Learning	Nov 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Efficient Drone Mobility Support Using Reinforcement Learning	Nov 21, 2019	Q-Learningreinforcement-learning	—Unverified
Accelerating Reinforcement Learning with Suboptimal Guidance	Nov 21, 2019	OpenAI Gymreinforcement-learning	—Unverified
Agent Probing Interaction Policies	Nov 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Memory-Efficient Episodic Control Reinforcement Learning with Dynamic Online k-means	Nov 21, 2019	Atari GamesClustering	CodeCode Available
State Alignment-based Imitation Learning	Nov 21, 2019	Imitation Learningreinforcement-learning	—Unverified
Sample-Efficient Reinforcement Learning with Maximum Entropy Mellowmax Episodic Control	Nov 21, 2019	Atari Gamesreinforcement-learning	CodeCode Available
Solving Online Threat Screening Games using Constrained Action Space Reinforcement Learning	Nov 20, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Safe Policies for Reinforcement Learning via Primal-Dual Methods	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
On Policy Learning Robust to Irreversible Events: An Application to Robotic In-Hand Manipulation	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning in Cryptocurrency Market Making	Nov 20, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hierarchical Average Reward Policy Gradient Algorithms	Nov 20, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Avoiding Jammers: A Reinforcement Learning Approach	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Tale of Two-Timescale Reinforcement Learning with the Tightest Finite-Time Bound	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
Corruption-robust exploration in episodic reinforcement learning	Nov 20, 2019	Multi-Armed Banditsreinforcement-learning	—Unverified
Bayesian Curiosity for Efficient Exploration in Reinforcement Learning	Nov 20, 2019	Efficient Explorationreinforcement-learning	CodeCode Available
Decision Making for Autonomous Driving via Augmented Adversarial Inverse Reinforcement Learning	Nov 19, 2019	Autonomous DrivingDecision Making	—Unverified
Attention-Privileged Reinforcement Learning	Nov 19, 2019	reinforcement-learningReinforcement Learning	—Unverified
Generalizable Resource Allocation in Stream Processing via Deep Reinforcement Learning	Nov 19, 2019	DecoderDeep Reinforcement Learning	CodeCode Available
Efficient decorrelation of features using Gramian in Reinforcement Learning	Nov 19, 2019	Atari Gamesreinforcement-learning	—Unverified
MANGA: Method Agnostic Neural-policy Generalization and Adaptation	Nov 19, 2019	Imitation LearningMuJoCo	—Unverified
Variance Reduced Advantage Estimation with δ Hindsight Credit Assignment	Nov 19, 2019	reinforcement-learningReinforcement Learning	—Unverified
Placement Optimization of Aerial Base Stations with Deep Reinforcement Learning	Nov 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Planning with Goal-Conditioned Policies	Nov 19, 2019	Decision Makingreinforcement-learning	CodeCode Available
Unsupervised Reinforcement Learning of Transferable Meta-Skills for Embodied Navigation	Nov 18, 2019	Deep Reinforcement LearningObject	—Unverified
Influence-aware Memory Architectures for Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Inducing Cooperation via Team Regret Minimization based Multi-Agent Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Comments on the Du-Kakade-Wang-Yang Lower Bounds	Nov 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Efficient Exploration through Intrinsic Motivation Learning for Unsupervised Subgoal Discovery in Model-Free Hierarchical Reinforcement Learning	Nov 18, 2019	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified
IKEA Furniture Assembly Environment for Long-Horizon Complex Manipulation Tasks	Nov 17, 2019	Industrial Robotsreinforcement-learning	CodeCode Available
Hebbian Synaptic Modifications in Spiking Neurons that Learn	Nov 17, 2019	reinforcement-learningReinforcement Learning	—Unverified
Generalized Maximum Causal Entropy for Inverse Reinforcement Learning	Nov 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Inverse Reinforcement Learning with Missing Data	Nov 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning from Imperfect Demonstrations under Soft Expert Guidance	Nov 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Missingness as Stability: Understanding the Structure of Missingness in Longitudinal EHR data and its Impact on Reinforcement Learning in Healthcare	Nov 16, 2019	Imputationreinforcement-learning	CodeCode Available
Off-Policy Policy Gradient Algorithms by Constraining the State Distribution Shift	Nov 16, 2019	continuous-controlContinuous Control	—Unverified
Data-efficient Co-Adaptation of Morphology and Behaviour with Deep Reinforcement Learning	Nov 15, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improved Exploration through Latent Trajectory Optimization in Deep Deterministic Policy Gradient	Nov 15, 2019	continuous-controlContinuous Control	—Unverified
Empirical Study of Off-Policy Policy Evaluation for Reinforcement Learning	Nov 15, 2019	BenchmarkingDiversity	CodeCode Available

Show:10 25 50

← PrevPage 235 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified