Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10351–10375 of 15113 papers

Title	Date	Tasks	Status	Hype
Accelerated Deep Reinforcement Learning Based Load Shedding for Emergency Voltage Control	Jun 22, 2020	Computational EfficiencyDeep Reinforcement Learning	—Unverified	0
Efficient Sampling-Based Maximum Entropy Inverse Reinforcement Learning with Application to Autonomous Driving	Jun 22, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified	0
dm_control: Software and Tasks for Continuous Control	Jun 22, 2020	continuous-controlContinuous Control	—Unverified	0
Graph Neural Networks and Reinforcement Learning for Behavior Generation in Semantic Environments	Jun 22, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified	0
Sample-Efficient Reinforcement Learning of Undercomplete POMDPs	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
QTRAN++: Improved Value Transformation for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Safe Reinforcement Learning via Curriculum Induction	Jun 22, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Provably Efficient Causal Reinforcement Learning with Confounded Observational Data	Jun 22, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Near-Optimal Reinforcement Learning with Self-Play	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified	0
Learning with AMIGo: Adversarially Motivated Intrinsic Goals	Jun 22, 2020	Meta-LearningReinforcement Learning (RL)	CodeCode Available	1
Ecological Reinforcement Learning	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Constrained Combinatorial Optimization with Reinforcement Learning	Jun 22, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Hierarchical Reinforcement Learning for Deep Goal Reasoning: An Expressiveness Analysis	Jun 21, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Mean Field Games with Strategic Complementarities	Jun 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Gradient-EM Bayesian Meta-learning	Jun 21, 2020	Computational EfficiencyFew-Shot Image Classification	—Unverified	0
Automated Optical Multi-layer Design via Deep Reinforcement Learning	Jun 21, 2020	Deep Reinforcement LearningPhysical Intuition	CodeCode Available	0
Breaking the Curse of Many Agents: Provable Mean Embedding Q-Iteration for Mean-Field Reinforcement Learning	Jun 21, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Sample Factory: Egocentric 3D Control from Pixels at 100000 FPS with Asynchronous Reinforcement Learning	Jun 21, 2020	FPS GamesGeneral Reinforcement Learning	CodeCode Available	1
Off-Policy Self-Critical Training for Transformer in Visual Paragraph Generation	Jun 21, 2020	Image CaptioningReinforcement Learning (RL)	—Unverified	0
Towards Tractable Optimism in Model-Based Reinforcement Learning	Jun 21, 2020	continuous-controlContinuous Control	—Unverified	0
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees	Jun 20, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Entropic Risk Constrained Soft-Robust Policy Optimization	Jun 20, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Accelerating Safe Reinforcement Learning with Constraint-mismatched Policies	Jun 20, 2020	Fairnessreinforcement-learning	—Unverified	0
Langevin Dynamics for Adaptive Inverse Reinforcement Learning of Stochastic Gradient Algorithms	Jun 20, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 415 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified