Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10351–10400 of 15113 papers

Title	Date	Tasks	Status	Hype
Accelerated Deep Reinforcement Learning Based Load Shedding for Emergency Voltage Control	Jun 22, 2020	Computational EfficiencyDeep Reinforcement Learning	—Unverified	0
Efficient Sampling-Based Maximum Entropy Inverse Reinforcement Learning with Application to Autonomous Driving	Jun 22, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified	0
dm_control: Software and Tasks for Continuous Control	Jun 22, 2020	continuous-controlContinuous Control	—Unverified	0
Graph Neural Networks and Reinforcement Learning for Behavior Generation in Semantic Environments	Jun 22, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified	0
Sample-Efficient Reinforcement Learning of Undercomplete POMDPs	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
QTRAN++: Improved Value Transformation for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Safe Reinforcement Learning via Curriculum Induction	Jun 22, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Provably Efficient Causal Reinforcement Learning with Confounded Observational Data	Jun 22, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Near-Optimal Reinforcement Learning with Self-Play	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified	0
Learning with AMIGo: Adversarially Motivated Intrinsic Goals	Jun 22, 2020	Meta-LearningReinforcement Learning (RL)	CodeCode Available	1
Ecological Reinforcement Learning	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Constrained Combinatorial Optimization with Reinforcement Learning	Jun 22, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Hierarchical Reinforcement Learning for Deep Goal Reasoning: An Expressiveness Analysis	Jun 21, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Mean Field Games with Strategic Complementarities	Jun 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Gradient-EM Bayesian Meta-learning	Jun 21, 2020	Computational EfficiencyFew-Shot Image Classification	—Unverified	0
Automated Optical Multi-layer Design via Deep Reinforcement Learning	Jun 21, 2020	Deep Reinforcement LearningPhysical Intuition	CodeCode Available	0
Breaking the Curse of Many Agents: Provable Mean Embedding Q-Iteration for Mean-Field Reinforcement Learning	Jun 21, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Sample Factory: Egocentric 3D Control from Pixels at 100000 FPS with Asynchronous Reinforcement Learning	Jun 21, 2020	FPS GamesGeneral Reinforcement Learning	CodeCode Available	1
Off-Policy Self-Critical Training for Transformer in Visual Paragraph Generation	Jun 21, 2020	Image CaptioningReinforcement Learning (RL)	—Unverified	0
Towards Tractable Optimism in Model-Based Reinforcement Learning	Jun 21, 2020	continuous-controlContinuous Control	—Unverified	0
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees	Jun 20, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Entropic Risk Constrained Soft-Robust Policy Optimization	Jun 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Accelerating Safe Reinforcement Learning with Constraint-mismatched Policies	Jun 20, 2020	Fairnessreinforcement-learning	—Unverified	0
Langevin Dynamics for Adaptive Inverse Reinforcement Learning of Stochastic Gradient Algorithms	Jun 20, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Generating Adjacency-Constrained Subgoals in Hierarchical Reinforcement Learning	Jun 20, 2020	continuous-controlContinuous Control	CodeCode Available	1
Deep Implicit Coordination Graphs for Multi-agent Reinforcement Learning	Jun 19, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	1
FISAR: Forward Invariant Safe Reinforcement Learning with a Deep Neural Network-Based Optimize	Jun 19, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Task-Agnostic Online Reinforcement Learning with an Infinite Mixture of Gaussian Processes	Jun 19, 2020	Continual LearningDecision Making	CodeCode Available	1
On Reward-Free Reinforcement Learning with Linear Function Approximation	Jun 19, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
NROWAN-DQN: A Stable Noisy Network with Noise Reduction and Online Weight Adjustment for Exploration	Jun 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Reinforcement Learning Approach for Transient Control of Liquid Rocket Engines	Jun 19, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified	0
Learn to Earn: Enabling Coordination within a Ride Hailing Fleet	Jun 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
WD3: Taming the Estimation Bias in Deep Reinforcement Learning	Jun 18, 2020	continuous-controlContinuous Control	—Unverified	0
Provably adaptive reinforcement learning in metric spaces	Jun 18, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Weighted QMIX: Expanding Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning	Jun 18, 2020	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Cooperative Multi-Agent Reinforcement Learning with Partial Observations	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Ridesharing Dispatch Using Multi-Agent Reinforcement Learning	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
FLAMBE: Structural Complexity and Representation Learning of Low Rank MDPs	Jun 18, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Interactive Recommender System via Knowledge Graph-enhanced Reinforcement Learning	Jun 18, 2020	Decision MakingRecommendation Systems	—Unverified	0
Deep Reinforcement Learning amidst Lifelong Non-Stationarity	Jun 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributed Value Function Approximation for Collaborative Multi-Agent Reinforcement Learning	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
DREAM: Deep Regret minimization with Advantage baselines and Model-free learning	Jun 18, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning Invariant Representations for Reinforcement Learning without Reconstruction	Jun 18, 2020	Causal InferenceMuJoCo	CodeCode Available	1
Converting Biomechanical Models from OpenSim to MuJoCo	Jun 17, 2020	MuJoCoreinforcement-learning	CodeCode Available	1
Eco-Vehicular Edge Networks for Connected Transportation: A Distributed Multi-Agent Reinforcement Learning Approach	Jun 17, 2020	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified	0
Green Simulation Assisted Reinforcement Learning with Model Risk for Biomanufacturing Learning and Control	Jun 17, 2020	Decision MakingModel-based Reinforcement Learning	CodeCode Available	0
Introduction to Machine Learning for Accelerator Physics	Jun 17, 2020	BIG-bench Machine Learningregression	—Unverified	0
Learning to Track Dynamic Targets in Partially Known Environments	Jun 17, 2020	Deep Reinforcement LearningNavigate	CodeCode Available	1
Deep Reinforcement Learning Controller for 3D Path-following and Collision Avoidance by Autonomous Underwater Vehicles	Jun 17, 2020	Collision AvoidanceDecision Making	—Unverified	0

Show:10 25 50

← PrevPage 208 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified