Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11901–11950 of 15113 papers

Title	Date	Tasks	Status	Hype
REFINING MONTE CARLO TREE SEARCH AGENTS BY MONTE CARLO TREE SEARCH	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning with Chromatic Networks	Sep 25, 2019	Neural Architecture Searchreinforcement-learning	—Unverified	0
Striving for Simplicity in Off-Policy Deep Reinforcement Learning	Sep 25, 2019	Atari GamesDeep Reinforcement Learning	—Unverified	0
Probabilistic View of Multi-agent Reinforcement Learning: A Unified Approach	Sep 25, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
MoET: Interpretable and Verifiable Reinforcement Learning via Mixture of Expert Trees	Sep 25, 2019	Deep Reinforcement LearningGame of Go	—Unverified	0
Temporal Difference Weighted Ensemble For Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Zero-Shot Policy Transfer with Disentangled Attention	Sep 25, 2019	Deep Reinforcement LearningDomain Adaptation	—Unverified	0
Model Ensemble-Based Intrinsic Reward for Sparse Reward Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Variational Constrained Reinforcement Learning with Application to Planning at Roundabout	Sep 25, 2019	Autonomous Drivingreinforcement-learning	—Unverified	0
Reinforcement learning for suppression of collective activity in oscillatory ensembles	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-task Batch Reinforcement Learning with Metric Learning	Sep 25, 2019	Meta Reinforcement LearningMetric Learning	—Unverified	0
ROBEL: Robotics Benchmarks for Learning with Low-Cost Robots	Sep 25, 2019	continuous-controlContinuous Control	CodeCode Available	0
Model Imitation for Model-Based Reinforcement Learning	Sep 25, 2019	modelModel-based Reinforcement Learning	—Unverified	0
C-3PO: Cyclic-Three-Phase Optimization for Human-Robot Motion Retargeting based on Reinforcement Learning	Sep 25, 2019	Deep Reinforcement Learningmotion retargeting	CodeCode Available	0
Data Valuation using Reinforcement Learning	Sep 25, 2019	Data ValuationDomain Adaptation	CodeCode Available	0
"Good Robot!": Efficient Reinforcement Learning for Multi-Step Visual Tasks with Sim to Real Transfer	Sep 25, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Efficient Inference and Exploration for Reinforcement Learning	Sep 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Avoidance Learning Using Observational Reinforcement Learning	Sep 24, 2019	Imitation Learningreinforcement-learning	—Unverified	0
Invariant Transform Experience Replay: Data Augmentation for Deep Reinforcement Learning	Sep 24, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	0
Active inference: demystified and compared	Sep 24, 2019	Atari GamesOpenAI Gym	CodeCode Available	0
Accept Synthetic Objects as Real: End-to-End Training of Attentive Deep Visuomotor Policies for Manipulation in Clutter	Sep 24, 2019	Data AugmentationImitation Learning	CodeCode Available	0
Brain-Inspired Hardware for Artificial Intelligence: Accelerated Learning in a Physical-Model Spiking Neural Network	Sep 24, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Controlling an Autonomous Vehicle with Deep Reinforcement Learning	Sep 24, 2019	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Power Allocation in Cache-Aided NOMA Systems: Optimization and Deep Reinforcement Learning Approaches	Sep 24, 2019	Deep Reinforcement LearningFairness	—Unverified	0
Paying Attention to Function Words	Sep 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Why Does Hierarchy (Sometimes) Work So Well in Reinforcement Learning?	Sep 23, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Modular Deep Reinforcement Learning with Temporal Logic Specifications	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Estimators for Reinforcement Learning	Sep 23, 2019	continuous-controlContinuous Control	CodeCode Available	0
Constrained Attractor Selection Using Deep Reinforcement Learning	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Integrating independent and centralized multi-agent reinforcement learning for traffic signal network optimization	Sep 23, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
PAC Reinforcement Learning without Real-World Feedback	Sep 23, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Where to Look Next: Unsupervised Active Visual Exploration on 360° Input	Sep 23, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Robot Navigation in Crowds by Graph Convolutional Networks with Attention Learned from Human Gaze	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Multi-task Learning and Catastrophic Forgetting in Continual Reinforcement Learning	Sep 22, 2019	Continual LearningDeep Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning with Modulated Hebbian plus Q Network Architecture	Sep 21, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Leveraging Human Guidance for Deep Reinforcement Learning Tasks	Sep 21, 2019	Deep Reinforcement LearningImitation Learning	—Unverified	0
How Much Do Unstated Problem Constraints Limit Deep Robotic Reinforcement Learning?	Sep 20, 2019	continuous-controlContinuous Control	—Unverified	0
A Layered Architecture for Active Perception: Image Classification using Deep Reinforcement Learning	Sep 20, 2019	Deep Reinforcement LearningGeneral Classification	—Unverified	0
Bayesian Optimization for Iterative Learning	Sep 20, 2019	Bayesian OptimizationDeep Reinforcement Learning	CodeCode Available	0
Meta-Inverse Reinforcement Learning with Probabilistic Context Variables	Sep 20, 2019	continuous-controlContinuous Control	CodeCode Available	0
Redirection Controller Using Reinforcement Learning	Sep 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
On the Convergence of Approximate and Regularized Policy Iteration Schemes	Sep 20, 2019	Q-LearningReinforcement Learning	—Unverified	0
Instance-dependent _-bounds for policy evaluation in tabular reinforcement learning	Sep 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Robot Sound Interpretation: Combining Sight and Sound in Learning-Based Control	Sep 19, 2019	Decision Makingreinforcement-learning	—Unverified	0
MACS: Deep Reinforcement Learning based SDN Controller Synchronization Policy Design	Sep 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Dependency-Aware Computation Offloading in Mobile Edge Computing: A Reinforcement Learning Approach	Sep 18, 2019	Cloud ComputingEdge-computing	—Unverified	0
Automated Lane Change Decision Making using Deep Reinforcement Learning in Dynamic and Uncertain Highway Environment	Sep 18, 2019	Autonomous DrivingDecision Making	—Unverified	0
A Human-Centered Data-Driven Planner-Actor-Critic Architecture via Logic Programming	Sep 18, 2019	General KnowledgeReinforcement Learning	—Unverified	0
DeepGait: Planning and Control of Quadrupedal Gaits using Deep Reinforcement Learning	Sep 18, 2019	Deep Reinforcement LearningMotion Planning	—Unverified	0
Visual Tracking by means of Deep Reinforcement Learning and an Expert Demonstrator	Sep 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 239 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified