Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10801–10850 of 15113 papers

Title	Date	Tasks	Status
Policy Evaluation and Seeking for Multi-Agent Reinforcement Learning via Best Response	Jun 17, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning with Uncertainty Estimation for Tactical Decision-Making in Intersections	Jun 17, 2020	Autonomous DrivingDecision Making	—Unverified
RL-CycleGAN: Reinforcement Learning Aware Simulation-To-Real	Jun 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Multi-Agent Reinforcement Learning for Adaptive User Association in Dynamic mmWave Networks	Jun 16, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
ShieldNN: A Provably Safe NN Filter for Unsafe NN Controllers	Jun 16, 2020	Reinforcement Learning (RL)	—Unverified
Parameter-Based Value Functions	Jun 16, 2020	continuous-controlContinuous Control	CodeCode Available
Preference-based Reinforcement Learning with Finite-Time Guarantees	Jun 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Task-agnostic Exploration in Reinforcement Learning	Jun 16, 2020	Efficient Explorationreinforcement-learning	—Unverified
Model Embedding Model-Based Reinforcement Learning	Jun 16, 2020	modelModel-based Reinforcement Learning	—Unverified
The Sample Complexity of Teaching-by-Reinforcement on Q-Learning	Jun 16, 2020	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning Control of Robotic Knee with Human in the Loop by Flexible Policy Iteration	Jun 16, 2020	Reinforcement Learning (RL)	—Unverified
Solving the Order Batching and Sequencing Problem using Deep Reinforcement Learning	Jun 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Online Reinforcement Learning Control by Direct Heuristic Dynamic Programming: from Time-Driven to Event-Driven	Jun 16, 2020	Reinforcement Learning (RL)	—Unverified
Index Selection for NoSQL Database with Deep Reinforcement Learning	Jun 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using Deep Reinforcement Learning	Jun 16, 2020	Autonomous VehiclesCollision Avoidance	—Unverified
Designing high-fidelity multi-qubit gates for semiconductor quantum dots through deep reinforcement learning	Jun 15, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
An online evolving framework for advancing reinforcement-learning based automated vehicle control	Jun 15, 2020	Decision Makingreinforcement-learning	—Unverified
Runtime Adaptation in Wireless Sensor Nodes Using Structured Learning	Jun 15, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Variable Gain Gradient Descent-based Reinforcement Learning for Robust Optimal Tracking Control of Uncertain Nonlinear System with Input-Constraints	Jun 15, 2020	reinforcement-learningReinforcement Learning	—Unverified
Multiagent Reinforcement Learning based Energy Beamforming Control	Jun 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Optimistic Distributionally Robust Policy Optimization	Jun 14, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Non-local Policy Optimization via Diversity-regularized Collaborative Exploration	Jun 14, 2020	DiversityMuJoCo	—Unverified
Reinforcement Learning with Supervision from Noisy Demonstrations	Jun 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Tackling Morpion Solitaire with AlphaZero-likeRanked Reward Reinforcement Learning	Jun 14, 2020	Game of Goreinforcement-learning	—Unverified
Adversarial Attacks and Detection on Reinforcement Learning-Based Interactive Recommender Systems	Jun 14, 2020	Interactive RecommendationRecommendation Systems	—Unverified
Hindsight Expectation Maximization for Goal-conditioned Reinforcement Learning	Jun 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning as Iterative and Amortised Inference	Jun 13, 2020	General Classificationreinforcement-learning	—Unverified
StarCraft II Build Order Optimization using Deep Reinforcement Learning and Monte-Carlo Tree Search	Jun 12, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using Reinforcement Learning to Allocate and Manage Service Function Chains in Cellular Networks	Jun 12, 2020	Managementreinforcement-learning	—Unverified
Systematic Generalisation through Task Temporal Logic and Deep Reinforcement Learning	Jun 12, 2020	Deep Reinforcement LearningNegation	—Unverified
Potential Field Guided Actor-Critic Reinforcement Learning	Jun 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Mutual Information Based Knowledge Transfer Under State-Action Dimension Mismatch	Jun 12, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
Meta-Reinforcement Learning Robust to Distributional Shift via Model Identification and Experience Relabeling	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified
Safety-guaranteed Reinforcement Learning based on Multi-class Support Vector Machine	Jun 12, 2020	Q-Learningreinforcement-learning	—Unverified
Recurrent Sum-Product-Max Networks for Decision Making in Perfectly-Observed Environments	Jun 12, 2020	Decision Makingreinforcement-learning	CodeCode Available
Decorrelated Double Q-learning	Jun 12, 2020	continuous-controlContinuous Control	—Unverified
Hierarchical reinforcement learning for efficent exploration and transfer	Jun 12, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Exchangeable Models in Meta Reinforcement Learning	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available
Human and Multi-Agent collaboration in a human-MARL teaming framework	Jun 12, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Explore then Execute: Adapting without Rewards via Factorized Meta-Reinforcement Learning	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified
Generalizing Curricula for Reinforcement Learning	Jun 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Intrinsically Motivated Options to Stimulate Policy Exploration	Jun 12, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Neural Control	Jun 12, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
A Brief Look at Generalization in Visual Meta-Reinforcement Learning	Jun 12, 2020	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified
Logical Composition in Lifelong Reinforcement Learning	Jun 12, 2020	Lifelong learningreinforcement-learning	—Unverified
Bridging Worlds in Reinforcement Learning with Model-Advantage	Jun 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Continuous Control for Searching and Planning with a Learned Model	Jun 12, 2020	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning for Electric Transmission Voltage Control	Jun 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Multi-Agent Reinforcement Learning in Stochastic Networked Systems	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Exploration by Maximizing Rényi Entropy for Reward-Free RL Framework	Jun 11, 2020	Q-LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 217 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified