Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9451–9500 of 15113 papers

Title	Date	Tasks	Status	Hype
Critic PI2: Master Continuous Planning via Policy Improvement with Path Integrals and Deep Actor-Critic Reinforcement Learning	Nov 13, 2020	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning of Transition States	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
DeepMind Lab2D	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Active Reinforcement Learning: Observing Rewards at a Cost	Nov 13, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified	0
A Review of Uncertainty Quantification in Deep Learning: Techniques, Applications and Challenges	Nov 12, 2020	Decision MakingEnsemble Learning	—Unverified	0
Imposing Robust Structured Control Constraint on Reinforcement Learning of Linear Quadratic Regulator	Nov 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Gaussian RAM: Lightweight Image Classification via Stochastic Retina-Inspired Glimpse and Reinforcement Learning	Nov 12, 2020	ClassificationGeneral Classification	CodeCode Available	1
Hierarchical reinforcement learning for efficient exploration and transfer	Nov 12, 2020	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified	0
Griddly: A platform for AI research in games	Nov 12, 2020	Reinforcement Learning (RL)	—Unverified	0
Self-supervised reinforcement learning for speaker localisation with the iCub humanoid robot	Nov 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Reinforcement Learning with Videos: Combining Offline Observations with Interaction	Nov 12, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Steady State Analysis of Episodic Reinforcement Learning	Nov 12, 2020	Continual Learningreinforcement-learning	—Unverified	0
Optimizing Large-Scale Fleet Management on a Road Network using Multi-Agent Deep Reinforcement Learning with Graph Neural Network	Nov 12, 2020	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	1
Adaptive Neural Architectures for Recommender Systems	Nov 11, 2020	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
Non-local Optimization: Imposing Structure on Optimization Problems by Relaxation	Nov 11, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
pymgrid: An Open-Source Python Microgrid Simulator for Applied Artificial Intelligence Research	Nov 11, 2020	Reinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning Experiments and Benchmark for Solving Robotic Reaching Tasks	Nov 11, 2020	Positionreinforcement-learning	CodeCode Available	0
Proximal Policy Optimization via Enhanced Exploration Efficiency	Nov 11, 2020	continuous-controlContinuous Control	—Unverified	0
Offline Learning of Counterfactual Predictions for Real-World Robotic Reinforcement Learning	Nov 11, 2020	counterfactualreinforcement-learning	—Unverified	0
Reinforcement Learning with Dual-Observation for General Video Game Playing	Nov 11, 2020	Decision Makingreinforcement-learning	CodeCode Available	0
Reinforcement Learning with Time-dependent Goals for Robotic Musicians	Nov 11, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Decentralized Motion Planning for Multi-Robot Navigation using Deep Reinforcement Learning	Nov 11, 2020	Deep Reinforcement LearningMotion Planning	CodeCode Available	1
On Using Hamiltonian Monte Carlo Sampling for Reinforcement Learning Problems in High-dimension	Nov 11, 2020	Matrix CompletionQ-Learning	—Unverified	0
CRPO: A New Approach for Safe Reinforcement Learning with Convergence Guarantee	Nov 11, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Behaviorally Diverse Traffic Simulation via Reinforcement Learning	Nov 11, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Kinematics-Guided Reinforcement Learning for Object-Aware 3D Ego-Pose Estimation	Nov 10, 2020	Human-Object Interaction DetectionObject	—Unverified	0
Dirichlet policies for reinforced factor portfolios	Nov 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Hierarchical Reinforcement Learning for Relay Selection and Power Optimization in Two-Hop Cooperative Relay Network	Nov 10, 2020	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Perturbation-based exploration methods in deep reinforcement learning	Nov 10, 2020	Atari GamesBenchmarking	—Unverified	0
Model-based Reinforcement Learning from Signal Temporal Logic Specifications	Nov 10, 2020	Autonomous VehiclesModel-based Reinforcement Learning	—Unverified	0
What Did You Think Would Happen? Explaining Agent Behaviour Through Intended Outcomes	Nov 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Sample Complexity Bounds for Two Timescale Value-based Reinforcement Learning Algorithms	Nov 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Optimizing Age of Information Through Aerial Reconfigurable Intelligent Surfaces: A Deep Reinforcement Learning Approach	Nov 9, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Challenges of Applying Deep Reinforcement Learning in Dynamic Dispatching	Nov 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Compose Hierarchical Object-Centric Controllers for Robotic Manipulation	Nov 9, 2020	Objectreinforcement-learning	—Unverified	0
Combining Propositional Logic Based Decision Diagrams with Decision Making in Urban Systems	Nov 9, 2020	Decision Makingreinforcement-learning	—Unverified	0
Behavior Planning at Urban Intersections through Hierarchical Reinforcement Learning	Nov 9, 2020	Autonomous VehiclesHierarchical Reinforcement Learning	—Unverified	0
On Function Approximation in Reinforcement Learning: Optimism in the Face of Large State Spaces	Nov 9, 2020	Reinforcement Learning (RL)	—Unverified	0
Decentralized Structural-RNN for Robot Crowd Navigation with Deep Reinforcement Learning	Nov 9, 2020	Deep Reinforcement LearningMotion Planning	CodeCode Available	1
Geometric Deep Reinforcement Learning for Dynamic DAG Scheduling	Nov 9, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Deep reinforcement learning for RAN optimization and control	Nov 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
f-IRL: Inverse Reinforcement Learning via State Marginal Matching	Nov 9, 2020	Imitation Learningreinforcement-learning	CodeCode Available	1
Automated Adversary Emulation for Cyber-Physical Systems via Reinforcement Learning	Nov 9, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Navigation in AAA Video Games	Nov 9, 2020	Deep Reinforcement LearningNavigate	—Unverified	0
Safe Trajectory Planning Using Reinforcement Learning for Self Driving	Nov 9, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Trajectory Planning for Autonomous Vehicles Using Hierarchical Reinforcement Learning	Nov 9, 2020	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Multi-Agent Reinforcement Learning for Channel Assignment and Power Allocation in Platoon-Based C-V2X Systems	Nov 9, 2020	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified	0
Reinforcement Learning for Autonomous Driving with Latent State Inference and Spatial-Temporal Relationships	Nov 9, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning for Assignment problem	Nov 8, 2020	Q-Learningreinforcement-learning	—Unverified	0
Online Sparse Reinforcement Learning	Nov 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 190 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified