Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10751–10775 of 15113 papers

Title	Date	Tasks	Status
Control-Aware Representations for Model-based Reinforcement Learning	Jun 24, 2020	modelModel-based Reinforcement Learning	—Unverified
Deep Reinforcement Learning Control for Radar Detection and Tracking in Congested Spectral Environments	Jun 23, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Batch-Constrained Reinforcement Learning for Dynamic Distribution Network Reconfiguration	Jun 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Environment Shaping in Reinforcement Learning using State Abstraction	Jun 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Risk-Sensitive Reinforcement Learning: a Martingale Approach to Reward Uncertainty	Jun 23, 2020	Decision MakingPortfolio Optimization	—Unverified
Provably Efficient Reinforcement Learning for Discounted MDPs with Feature Mapping	Jun 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Online Multi-agent Reinforcement Learning for Decentralized Inverter-based Volt-VAR Control	Jun 23, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
The Effect of Multi-step Methods on Overestimation in Deep Reinforcement Learning	Jun 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Show me the Way: Intrinsic Motivation from Demonstrations	Jun 23, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
On the Relationship Between Active Inference and Control as Inference	Jun 23, 2020	Decision Makingreinforcement-learning	—Unverified
Near-Optimal Reinforcement Learning with Self-Play	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
Provably Efficient Causal Reinforcement Learning with Confounded Observational Data	Jun 22, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Sample-Efficient Reinforcement Learning of Undercomplete POMDPs	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
QTRAN++: Improved Value Transformation for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
Constrained Combinatorial Optimization with Reinforcement Learning	Jun 22, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Efficient Sampling-Based Maximum Entropy Inverse Reinforcement Learning with Application to Autonomous Driving	Jun 22, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
dm_control: Software and Tasks for Continuous Control	Jun 22, 2020	continuous-controlContinuous Control	—Unverified
Ecological Reinforcement Learning	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
Accelerated Deep Reinforcement Learning Based Load Shedding for Emergency Voltage Control	Jun 22, 2020	Computational EfficiencyDeep Reinforcement Learning	—Unverified
Automated Optical Multi-layer Design via Deep Reinforcement Learning	Jun 21, 2020	Deep Reinforcement LearningPhysical Intuition	CodeCode Available
Reinforcement Learning for Mean Field Games with Strategic Complementarities	Jun 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Gradient-EM Bayesian Meta-learning	Jun 21, 2020	Computational EfficiencyFew-Shot Image Classification	—Unverified
Hierarchical Reinforcement Learning for Deep Goal Reasoning: An Expressiveness Analysis	Jun 21, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Breaking the Curse of Many Agents: Provable Mean Embedding Q-Iteration for Mean-Field Reinforcement Learning	Jun 21, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 431 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified