Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7901–7950 of 15113 papers

Title	Date	Tasks	Status	Hype
Branch Prediction as a Reinforcement Learning Problem: Why, How and Case Studies	Jun 25, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Control of a Mixed Autonomy Signalised Urban Intersection: An Action-Delayed Reinforcement Learning Approach	Jun 24, 2021	Reinforcement Learning (RL)	—Unverified	0
Brax -- A Differentiable Physics Engine for Large Scale Rigid Body Simulation	Jun 24, 2021	MuJoCoOpenAI Gym	CodeCode Available	2
Density Constrained Reinforcement Learning	Jun 24, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Model-Based Reinforcement Learning via Latent-Space Collocation	Jun 24, 2021	modelModel-based Reinforcement Learning	CodeCode Available	1
Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy Evaluation	Jun 24, 2021	Meta Reinforcement LearningOff-policy evaluation	CodeCode Available	1
Hierarchically Integrated Models: Learning to Navigate from Heterogeneous Robots	Jun 24, 2021	Deep Reinforcement LearningNavigate	—Unverified	0
The Option Keyboard: Combining Skills in Reinforcement Learning	Jun 24, 2021	Managementreinforcement-learning	—Unverified	0
Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit Argument Relations	Jun 23, 2021	Event ExtractionIncremental Learning	CodeCode Available	1
Evolving Hierarchical Memory-Prediction Machines in Multi-Task Reinforcement Learning	Jun 23, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Bregman Gradient Policy Optimization	Jun 23, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Uncertainty-Aware Model-Based Reinforcement Learning with Application to Autonomous Driving	Jun 23, 2021	Autonomous DrivingModel-based Reinforcement Learning	—Unverified	0
Provably Efficient Representation Selection in Low-rank Markov Decision Processes: From Online to Offline RL	Jun 22, 2021	Deep Reinforcement LearningOffline RL	—Unverified	0
Uniform-PAC Bounds for Reinforcement Learning with Linear Function Approximation	Jun 22, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Local policy search with Bayesian optimization	Jun 22, 2021	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1
Off-Policy Reinforcement Learning with Delayed Rewards	Jun 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
MMD-MIX: Value Function Factorisation with Maximum Mean Discrepancy for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2021	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Variance-Aware Off-Policy Evaluation with Linear Function Approximation	Jun 22, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Physical Layer Communications	Jun 22, 2021	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available	0
Agnostic Reinforcement Learning with Low-Rank MDPs and Rich Observations	Jun 22, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Reduction-Based Framework for Conservative Bandits and Reinforcement Learning	Jun 22, 2021	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Lifted Model Checking for Relational MDPs	Jun 22, 2021	modelModel-based Reinforcement Learning	—Unverified	0
Distributed Heuristic Multi-Agent Path Finding with Communication	Jun 21, 2021	Multi-Agent Path FindingQ-Learning	CodeCode Available	1
Cogment: Open Source Framework For Distributed Multi-actor Training, Deployment & Operations	Jun 21, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Emphatic Algorithms for Deep Reinforcement Learning	Jun 21, 2021	Atari GamesDeep Reinforcement Learning	—Unverified	0
Interpretable Model-based Hierarchical Reinforcement Learning using Inductive Logic Programming	Jun 21, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Reinforcement Learning for Resource Allocation in Steerable Laser-based Optical Wireless Systems	Jun 21, 2021	ManagementQ-Learning	—Unverified	0
Policy Smoothing for Provably Robust Reinforcement Learning	Jun 21, 2021	Adversarial Robustnessimage-classification	—Unverified	0
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation	Jun 21, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Scientific multi-agent reinforcement learning for wall-models of turbulent flows	Jun 21, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Analytically Tractable Bayesian Deep Q-Learning	Jun 21, 2021	Q-Learningreinforcement-learning	—Unverified	0
Unsupervised Learning for Robust Fitting: A Reinforcement Learning Approach	Jun 19, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Video Summarization through Reinforcement Learning with a 3D Spatio-Temporal U-Net	Jun 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Boosting Offline Reinforcement Learning with Residual Generative Modeling	Jun 19, 2021	Offline RLQ-Learning	—Unverified	0
A Max-Min Entropy Framework for Reinforcement Learning	Jun 19, 2021	Disentanglementreinforcement-learning	CodeCode Available	1
Adversarially Trained Neural Policies in the Fourier Domain	Jun 18, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Towards Safe Reinforcement Learning via Constraining Conditional Value at Risk	Jun 18, 2021	continuous-controlContinuous Control	CodeCode Available	1
Non-Robust Feature Mapping in Deep Reinforcement Learning	Jun 18, 2021	Atari GamesDeep Reinforcement Learning	—Unverified	0
Strategically-timed State-Observation Attacks on Deep Reinforcement Learning Agents	Jun 18, 2021	Adversarial Attackcontinuous-control	—Unverified	0
Sample Efficient Social Navigation Using Inverse Reinforcement Learning	Jun 18, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Scenic4RL: Programmatic Modeling and Generation of Reinforcement Learning Environments	Jun 18, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Proper Value Equivalence	Jun 18, 2021	Model-based Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
MADE: Exploration via Maximizing Deviation from Explored Regions	Jun 18, 2021	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	1
The Curse of Passive Data Collection in Batch Reinforcement Learning	Jun 18, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning Models Predict Visual Responses in the Brain: A Preliminary Result	Jun 18, 2021	Deep Reinforcement LearningObject Recognition	—Unverified	0
Goal-Directed Planning by Reinforcement Learning and Active Inference	Jun 18, 2021	Bayesian InferenceDecision Making	—Unverified	0
Deep reinforcement learning with automated label extraction from clinical reports accurately classifies 3D MRI brain volumes	Jun 17, 2021	ClassificationDeep Reinforcement Learning	—Unverified	0
A Reinforcement Learning Approach for an IRS-assisted NOMA Network	Jun 17, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Adapting the Function Approximation Architecture in Online Reinforcement Learning	Jun 17, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning Based Optimization for IRS Based UAV-NOMA Downlink Networks	Jun 17, 2021	Deep Reinforcement LearningPosition	—Unverified	0

Show:10 25 50

← PrevPage 159 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified