Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12051–12100 of 15113 papers

Title	Date	Tasks	Status
Multiagent Reinforcement Learning in Games with an Iterated Dominance Solution	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
QXplore: Q-Learning Exploration by Maximizing Temporal Difference Error	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Policy Optimization by Local Improvement through Search	Sep 25, 2019	Imitation Learningreinforcement-learning	—Unverified
Reinforcement learning for suppression of collective activity in oscillatory ensembles	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Training a Constrained Natural Media Painting Agent using Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Temporal Difference Weighted Ensemble For Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Model Ensemble-Based Intrinsic Reward for Sparse Reward Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Multi-step Greedy Policies in Model-Free Deep Reinforcement Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Model-free Learning Control of Nonlinear Stochastic Systems with Stability Guarantee	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Self-Supervised State-Control through Intrinsic Mutual Information Rewards	Sep 25, 2019	OpenAI Gymreinforcement-learning	CodeCode Available
Probabilistic View of Multi-agent Reinforcement Learning: A Unified Approach	Sep 25, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Meta Learning via Learned Loss	Sep 25, 2019	Meta-Learningreinforcement-learning	—Unverified
Sequence-level Intrinsic Exploration Model for Partially Observable Domains	Sep 25, 2019	Predictionreinforcement-learning	—Unverified
Model Imitation for Model-Based Reinforcement Learning	Sep 25, 2019	modelModel-based Reinforcement Learning	—Unverified
Modeling Fake News in Social Networks with Deep Multi-Agent Reinforcement Learning	Sep 25, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Zero-Shot Policy Transfer with Disentangled Attention	Sep 25, 2019	Deep Reinforcement LearningDomain Adaptation	—Unverified
REFINING MONTE CARLO TREE SEARCH AGENTS BY MONTE CARLO TREE SEARCH	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Subjective Reinforcement Learning for Open Complex Environments	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
ROBEL: Robotics Benchmarks for Learning with Low-Cost Robots	Sep 25, 2019	continuous-controlContinuous Control	CodeCode Available
Variational Constrained Reinforcement Learning with Application to Planning at Roundabout	Sep 25, 2019	Autonomous Drivingreinforcement-learning	—Unverified
S2VG: Soft Stochastic Value Gradient method	Sep 25, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
MoET: Interpretable and Verifiable Reinforcement Learning via Mixture of Expert Trees	Sep 25, 2019	Deep Reinforcement LearningGame of Go	—Unverified
Policy Tree Network	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified
Solving single-objective tasks by preference multi-objective reinforcement learning	Sep 25, 2019	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Partial Simulation for Imitation Learning	Sep 25, 2019	Imitation LearningReinforcement Learning (RL)	—Unverified
Multi-Agent Hierarchical Reinforcement Learning for Humanoid Navigation	Sep 25, 2019	Collision AvoidanceHierarchical Reinforcement Learning	—Unverified
Striving for Simplicity in Off-Policy Deep Reinforcement Learning	Sep 25, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Reinforcement Learning with Chromatic Networks	Sep 25, 2019	Neural Architecture Searchreinforcement-learning	—Unverified
Sparse Skill Coding: Learning Behavioral Hierarchies with Sparse Codes	Sep 25, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Mint: Matrix-Interleaving for Multi-Task Learning	Sep 25, 2019	Multi-Task Learningreinforcement-learning	—Unverified
Stabilizing Off-Policy Reinforcement Learning with Conservative Policy Gradients	Sep 25, 2019	Deep Reinforcement LearningMuJoCo	—Unverified
Robust Domain Randomization for Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Pre-training as Batch Meta Reinforcement Learning with tiMe	Sep 25, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified
Paying Attention to Function Words	Sep 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Power Allocation in Cache-Aided NOMA Systems: Optimization and Deep Reinforcement Learning Approaches	Sep 24, 2019	Deep Reinforcement LearningFairness	—Unverified
Controlling an Autonomous Vehicle with Deep Reinforcement Learning	Sep 24, 2019	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Avoidance Learning Using Observational Reinforcement Learning	Sep 24, 2019	Imitation Learningreinforcement-learning	—Unverified
Accept Synthetic Objects as Real: End-to-End Training of Attentive Deep Visuomotor Policies for Manipulation in Clutter	Sep 24, 2019	Data AugmentationImitation Learning	CodeCode Available
Efficient Inference and Exploration for Reinforcement Learning	Sep 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Active inference: demystified and compared	Sep 24, 2019	Atari GamesOpenAI Gym	CodeCode Available
Invariant Transform Experience Replay: Data Augmentation for Deep Reinforcement Learning	Sep 24, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available
Brain-Inspired Hardware for Artificial Intelligence: Accelerated Learning in a Physical-Model Spiking Neural Network	Sep 24, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
PAC Reinforcement Learning without Real-World Feedback	Sep 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
Constrained Attractor Selection Using Deep Reinforcement Learning	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Integrating independent and centralized multi-agent reinforcement learning for traffic signal network optimization	Sep 23, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Where to Look Next: Unsupervised Active Visual Exploration on 360° Input	Sep 23, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
Robot Navigation in Crowds by Graph Convolutional Networks with Attention Learned from Human Gaze	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Estimators for Reinforcement Learning	Sep 23, 2019	continuous-controlContinuous Control	CodeCode Available
Modular Deep Reinforcement Learning with Temporal Logic Specifications	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Why Does Hierarchy (Sometimes) Work So Well in Reinforcement Learning?	Sep 23, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 242 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified