Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10751–10800 of 15113 papers

Title	Date	Tasks	Status
Control-Aware Representations for Model-based Reinforcement Learning	Jun 24, 2020	modelModel-based Reinforcement Learning	—Unverified
Deep Reinforcement Learning Control for Radar Detection and Tracking in Congested Spectral Environments	Jun 23, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Batch-Constrained Reinforcement Learning for Dynamic Distribution Network Reconfiguration	Jun 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Environment Shaping in Reinforcement Learning using State Abstraction	Jun 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Risk-Sensitive Reinforcement Learning: a Martingale Approach to Reward Uncertainty	Jun 23, 2020	Decision MakingPortfolio Optimization	—Unverified
Provably Efficient Reinforcement Learning for Discounted MDPs with Feature Mapping	Jun 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Online Multi-agent Reinforcement Learning for Decentralized Inverter-based Volt-VAR Control	Jun 23, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
The Effect of Multi-step Methods on Overestimation in Deep Reinforcement Learning	Jun 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Show me the Way: Intrinsic Motivation from Demonstrations	Jun 23, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
On the Relationship Between Active Inference and Control as Inference	Jun 23, 2020	Decision Makingreinforcement-learning	—Unverified
Near-Optimal Reinforcement Learning with Self-Play	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
Provably Efficient Causal Reinforcement Learning with Confounded Observational Data	Jun 22, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Sample-Efficient Reinforcement Learning of Undercomplete POMDPs	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
QTRAN++: Improved Value Transformation for Cooperative Multi-Agent Reinforcement Learning	Jun 22, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret	Jun 22, 2020	Q-Learningreinforcement-learning	—Unverified
Constrained Combinatorial Optimization with Reinforcement Learning	Jun 22, 2020	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Efficient Sampling-Based Maximum Entropy Inverse Reinforcement Learning with Application to Autonomous Driving	Jun 22, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
dm_control: Software and Tasks for Continuous Control	Jun 22, 2020	continuous-controlContinuous Control	—Unverified
Ecological Reinforcement Learning	Jun 22, 2020	reinforcement-learningReinforcement Learning	—Unverified
Accelerated Deep Reinforcement Learning Based Load Shedding for Emergency Voltage Control	Jun 22, 2020	Computational EfficiencyDeep Reinforcement Learning	—Unverified
Automated Optical Multi-layer Design via Deep Reinforcement Learning	Jun 21, 2020	Deep Reinforcement LearningPhysical Intuition	CodeCode Available
Reinforcement Learning for Mean Field Games with Strategic Complementarities	Jun 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Gradient-EM Bayesian Meta-learning	Jun 21, 2020	Computational EfficiencyFew-Shot Image Classification	—Unverified
Hierarchical Reinforcement Learning for Deep Goal Reasoning: An Expressiveness Analysis	Jun 21, 2020	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Breaking the Curse of Many Agents: Provable Mean Embedding Q-Iteration for Mean-Field Reinforcement Learning	Jun 21, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Off-Policy Self-Critical Training for Transformer in Visual Paragraph Generation	Jun 21, 2020	Image CaptioningReinforcement Learning (RL)	—Unverified
Towards Tractable Optimism in Model-Based Reinforcement Learning	Jun 21, 2020	continuous-controlContinuous Control	—Unverified
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees	Jun 20, 2020	OpenAI Gymreinforcement-learning	—Unverified
Accelerating Safe Reinforcement Learning with Constraint-mismatched Policies	Jun 20, 2020	Fairnessreinforcement-learning	—Unverified
Entropic Risk Constrained Soft-Robust Policy Optimization	Jun 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Langevin Dynamics for Adaptive Inverse Reinforcement Learning of Stochastic Gradient Algorithms	Jun 20, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learn to Earn: Enabling Coordination within a Ride Hailing Fleet	Jun 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Reinforcement Learning Approach for Transient Control of Liquid Rocket Engines	Jun 19, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified
NROWAN-DQN: A Stable Noisy Network with Noise Reduction and Online Weight Adjustment for Exploration	Jun 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
FISAR: Forward Invariant Safe Reinforcement Learning with a Deep Neural Network-Based Optimize	Jun 19, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
On Reward-Free Reinforcement Learning with Linear Function Approximation	Jun 19, 2020	reinforcement-learningReinforcement Learning	—Unverified
Provably adaptive reinforcement learning in metric spaces	Jun 18, 2020	reinforcement-learningReinforcement Learning	—Unverified
WD3: Taming the Estimation Bias in Deep Reinforcement Learning	Jun 18, 2020	continuous-controlContinuous Control	—Unverified
FLAMBE: Structural Complexity and Representation Learning of Low Rank MDPs	Jun 18, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Efficient Ridesharing Dispatch Using Multi-Agent Reinforcement Learning	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Cooperative Multi-Agent Reinforcement Learning with Partial Observations	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Distributed Value Function Approximation for Collaborative Multi-Agent Reinforcement Learning	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Interactive Recommender System via Knowledge Graph-enhanced Reinforcement Learning	Jun 18, 2020	Decision MakingRecommendation Systems	—Unverified
Deep Reinforcement Learning amidst Lifelong Non-Stationarity	Jun 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning Controller for 3D Path-following and Collision Avoidance by Autonomous Underwater Vehicles	Jun 17, 2020	Collision AvoidanceDecision Making	—Unverified
Delta Schema Network in Model-based Reinforcement Learning	Jun 17, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Eco-Vehicular Edge Networks for Connected Transportation: A Distributed Multi-Agent Reinforcement Learning Approach	Jun 17, 2020	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
Introduction to Machine Learning for Accelerator Physics	Jun 17, 2020	BIG-bench Machine Learningregression	—Unverified
Green Simulation Assisted Reinforcement Learning with Model Risk for Biomanufacturing Learning and Control	Jun 17, 2020	Decision MakingModel-based Reinforcement Learning	CodeCode Available
Parameterized MDPs and Reinforcement Learning Problems -- A Maximum Entropy Principle Based Framework	Jun 17, 2020	Decision MakingQ-Learning	—Unverified

Show:10 25 50

← PrevPage 216 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified