Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10401–10450 of 15113 papers

Title	Date	Tasks	Status	Hype
Delta Schema Network in Model-based Reinforcement Learning	Jun 17, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Automatic Curriculum Learning through Value Disagreement	Jun 17, 2020	Reinforcement Learning (RL)	CodeCode Available	1
Forgetful Experience Replay in Hierarchical Reinforcement Learning from Demonstrations	Jun 17, 2020	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	1
Reinforcement Learning with Uncertainty Estimation for Tactical Decision-Making in Intersections	Jun 17, 2020	Autonomous DrivingDecision Making	—Unverified	0
Policy Evaluation and Seeking for Multi-Agent Reinforcement Learning via Best Response	Jun 17, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Ordinary Differential Equation Control of Dynamics on Graphs	Jun 17, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Parameterized MDPs and Reinforcement Learning Problems -- A Maximum Entropy Principle Based Framework	Jun 17, 2020	Decision MakingQ-Learning	—Unverified	0
Agent Modelling under Partial Observability for Deep Reinforcement Learning	Jun 16, 2020	DecoderDeep Reinforcement Learning	CodeCode Available	1
Task-agnostic Exploration in Reinforcement Learning	Jun 16, 2020	Efficient Explorationreinforcement-learning	—Unverified	0
ShieldNN: A Provably Safe NN Filter for Unsafe NN Controllers	Jun 16, 2020	Reinforcement Learning (RL)	—Unverified	0
Solving the Order Batching and Sequencing Problem using Deep Reinforcement Learning	Jun 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
COLREG-Compliant Collision Avoidance for Unmanned Surface Vehicle using Deep Reinforcement Learning	Jun 16, 2020	Autonomous VehiclesCollision Avoidance	—Unverified	0
AWAC: Accelerating Online Reinforcement Learning with Offline Datasets	Jun 16, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Index Selection for NoSQL Database with Deep Reinforcement Learning	Jun 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Robot Perception enables Complex Navigation Behavior via Self-Supervised Learning	Jun 16, 2020	Reinforcement Learning (RL)Self-Supervised Learning	CodeCode Available	1
Model-based Adversarial Meta-Reinforcement Learning	Jun 16, 2020	continuous-controlContinuous Control	CodeCode Available	1
Model Embedding Model-Based Reinforcement Learning	Jun 16, 2020	modelModel-based Reinforcement Learning	—Unverified	0
The Sample Complexity of Teaching-by-Reinforcement on Q-Learning	Jun 16, 2020	Q-Learningreinforcement-learning	—Unverified	0
Parameter-Based Value Functions	Jun 16, 2020	continuous-controlContinuous Control	CodeCode Available	0
RL-CycleGAN: Reinforcement Learning Aware Simulation-To-Real	Jun 16, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Preference-based Reinforcement Learning with Finite-Time Guarantees	Jun 16, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Reinforcement Learning for Adaptive User Association in Dynamic mmWave Networks	Jun 16, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Online Reinforcement Learning Control by Direct Heuristic Dynamic Programming: from Time-Driven to Event-Driven	Jun 16, 2020	Reinforcement Learning (RL)	—Unverified	0
Reinforcement Learning Control of Robotic Knee with Human in the Loop by Flexible Policy Iteration	Jun 16, 2020	Reinforcement Learning (RL)	—Unverified	0
Multiagent Reinforcement Learning based Energy Beamforming Control	Jun 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Runtime Adaptation in Wireless Sensor Nodes Using Structured Learning	Jun 15, 2020	Q-LearningReinforcement Learning (RL)	—Unverified	0
Variable Gain Gradient Descent-based Reinforcement Learning for Robust Optimal Tracking Control of Uncertain Nonlinear System with Input-Constraints	Jun 15, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Designing high-fidelity multi-qubit gates for semiconductor quantum dots through deep reinforcement learning	Jun 15, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Model-Based Reinforcement Learning through Optimistic Policy Search and Planning	Jun 15, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Analytic Manifold Learning: Unifying and Evaluating Representations for Continuous Control	Jun 15, 2020	continuous-controlContinuous Control	CodeCode Available	1
MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration	Jun 15, 2020	Efficient ExplorationMeta Reinforcement Learning	CodeCode Available	1
An online evolving framework for advancing reinforcement-learning based automated vehicle control	Jun 15, 2020	Decision Makingreinforcement-learning	—Unverified	0
Pipeline PSRO: A Scalable Approach for Finding Approximate Nash Equilibria in Large Games	Jun 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Tackling Morpion Solitaire with AlphaZero-likeRanked Reward Reinforcement Learning	Jun 14, 2020	Game of Goreinforcement-learning	—Unverified	0
Optimistic Distributionally Robust Policy Optimization	Jun 14, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Reinforcement Learning with Supervision from Noisy Demonstrations	Jun 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Non-local Policy Optimization via Diversity-regularized Collaborative Exploration	Jun 14, 2020	DiversityMuJoCo	—Unverified	0
Benchmarking Multi-Agent Deep Reinforcement Learning Algorithms in Cooperative Tasks	Jun 14, 2020	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
Adversarial Attacks and Detection on Reinforcement Learning-Based Interactive Recommender Systems	Jun 14, 2020	Interactive RecommendationRecommendation Systems	—Unverified	0
Reinforcement Learning as Iterative and Amortised Inference	Jun 13, 2020	General Classificationreinforcement-learning	—Unverified	0
Hindsight Expectation Maximization for Goal-conditioned Reinforcement Learning	Jun 13, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Bridging Worlds in Reinforcement Learning with Model-Advantage	Jun 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Exchangeable Models in Meta Reinforcement Learning	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	0
Explore then Execute: Adapting without Rewards via Factorized Meta-Reinforcement Learning	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Generalizing Curricula for Reinforcement Learning	Jun 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Intrinsically Motivated Options to Stimulate Policy Exploration	Jun 12, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Hierarchical reinforcement learning for efficent exploration and transfer	Jun 12, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Logical Composition in Lifelong Reinforcement Learning	Jun 12, 2020	Lifelong learningreinforcement-learning	—Unverified	0
StarCraft II Build Order Optimization using Deep Reinforcement Learning and Monte-Carlo Tree Search	Jun 12, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Systematic Generalisation through Task Temporal Logic and Deep Reinforcement Learning	Jun 12, 2020	Deep Reinforcement LearningNegation	—Unverified	0

Show:10 25 50

← PrevPage 209 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified