Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11501–11550 of 15113 papers

Title	Date	Tasks	Status	Hype
Adaptive Modulation and Coding based on Reinforcement Learning for 5G Networks	Nov 25, 2019	Q-Learningreinforcement-learning	—Unverified	0
Biologically inspired architectures for sample-efficient deep reinforcement learning	Nov 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Multi-Driver Vehicle Dispatching and Repositioning Problem	Nov 25, 2019	BIG-bench Machine LearningDecision Making	—Unverified	0
Theory-based Causal Transfer: Integrating Instance-level Induction and Abstract-level Structure Learning	Nov 25, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Mitigate Bias in Face Recognition using Skewness-Aware Reinforcement Learning	Nov 25, 2019	Face RecognitionFairness	—Unverified	0
End-to-End Model-Free Reinforcement Learning for Urban Driving using Implicit Affordances	Nov 25, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available	0
A Deep Reinforcement Learning Architecture for Multi-stage Optimal Control	Nov 25, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
Learning to Optimize Variational Quantum Circuits to Solve Combinatorial Problems	Nov 25, 2019	Combinatorial OptimizationDensity Estimation	CodeCode Available	0
Multi-Agent Reinforcement Learning: A Selective Overview of Theories and Algorithms	Nov 24, 2019	Autonomous DrivingDecision Making	—Unverified	0
Which Channel to Ask My Question? Personalized Customer Service RequestStream Routing using DeepReinforcement Learning	Nov 24, 2019	ChatbotDeep Reinforcement Learning	—Unverified	0
Scaling active inference	Nov 24, 2019	Efficient ExplorationReinforcement Learning	—Unverified	0
ORL: Reinforcement Learning Benchmarks for Online Stochastic Optimization Problems	Nov 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Dynamic Control of a Fiber Manufacturing Process using Deep Reinforcement Learning	Nov 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Corpus-Level End-to-End Exploration for Interactive Systems	Nov 23, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
From Persistent Homology to Reinforcement Learning with Applications for Retail Banking	Nov 23, 2019	Managementreinforcement-learning	—Unverified	0
Iteratively-Refined Interactive 3D Medical Image Segmentation with Multi-Agent Reinforcement Learning	Nov 23, 2019	Image SegmentationMedical Image Segmentation	—Unverified	0
Deep Reinforcement Learning for Trading	Nov 22, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Graph Pruning for Model Compression	Nov 22, 2019	AutoMLmodel	—Unverified	0
Analysis of Evolutionary Behavior in Self-Learning Media Search Engines	Nov 22, 2019	Diversityreinforcement-learning	—Unverified	0
DeepSynth: Automata Synthesis for Automatic Task Segmentation in Deep Reinforcement Learning	Nov 22, 2019	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	0
Fleet Control using Coregionalized Gaussian Process Policy Iteration	Nov 22, 2019	Gaussian Processesreinforcement-learning	CodeCode Available	0
Information-Theoretic Confidence Bounds for Reinforcement Learning	Nov 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Accelerating Reinforcement Learning with Suboptimal Guidance	Nov 21, 2019	OpenAI Gymreinforcement-learning	—Unverified	0
Efficient Drone Mobility Support Using Reinforcement Learning	Nov 21, 2019	Q-Learningreinforcement-learning	—Unverified	0
State Alignment-based Imitation Learning	Nov 21, 2019	Imitation Learningreinforcement-learning	—Unverified	0
Memory-Efficient Episodic Control Reinforcement Learning with Dynamic Online k-means	Nov 21, 2019	Atari GamesClustering	CodeCode Available	0
Sample-Efficient Reinforcement Learning with Maximum Entropy Mellowmax Episodic Control	Nov 21, 2019	Atari Gamesreinforcement-learning	CodeCode Available	0
Agent Probing Interaction Policies	Nov 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning in Cryptocurrency Market Making	Nov 20, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Tale of Two-Timescale Reinforcement Learning with the Tightest Finite-Time Bound	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Safe Policies for Reinforcement Learning via Primal-Dual Methods	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Solving Online Threat Screening Games using Constrained Action Space Reinforcement Learning	Nov 20, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
On Policy Learning Robust to Irreversible Events: An Application to Robotic In-Hand Manipulation	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Bayesian Curiosity for Efficient Exploration in Reinforcement Learning	Nov 20, 2019	Efficient Explorationreinforcement-learning	CodeCode Available	0
Corruption-robust exploration in episodic reinforcement learning	Nov 20, 2019	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Avoiding Jammers: A Reinforcement Learning Approach	Nov 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Average Reward Policy Gradient Algorithms	Nov 20, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Generalizable Resource Allocation in Stream Processing via Deep Reinforcement Learning	Nov 19, 2019	DecoderDeep Reinforcement Learning	CodeCode Available	0
Efficient decorrelation of features using Gramian in Reinforcement Learning	Nov 19, 2019	Atari Gamesreinforcement-learning	—Unverified	0
Attention-Privileged Reinforcement Learning	Nov 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Decision Making for Autonomous Driving via Augmented Adversarial Inverse Reinforcement Learning	Nov 19, 2019	Autonomous DrivingDecision Making	—Unverified	0
MANGA: Method Agnostic Neural-policy Generalization and Adaptation	Nov 19, 2019	Imitation LearningMuJoCo	—Unverified	0
Variance Reduced Advantage Estimation with δ Hindsight Credit Assignment	Nov 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Planning with Goal-Conditioned Policies	Nov 19, 2019	Decision Makingreinforcement-learning	CodeCode Available	0
Placement Optimization of Aerial Base Stations with Deep Reinforcement Learning	Nov 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Exploration through Intrinsic Motivation Learning for Unsupervised Subgoal Discovery in Model-Free Hierarchical Reinforcement Learning	Nov 18, 2019	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified	0
Comments on the Du-Kakade-Wang-Yang Lower Bounds	Nov 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Influence-aware Memory Architectures for Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Inducing Cooperation via Team Regret Minimization based Multi-Agent Deep Reinforcement Learning	Nov 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Unsupervised Reinforcement Learning of Transferable Meta-Skills for Embodied Navigation	Nov 18, 2019	Deep Reinforcement LearningObject	—Unverified	0

Show:10 25 50

← PrevPage 231 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified