Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10776–10800 of 15113 papers

Title	Date	Tasks	Status
Off-Policy Self-Critical Training for Transformer in Visual Paragraph Generation	Jun 21, 2020	Image CaptioningReinforcement Learning (RL)	—Unverified
Towards Tractable Optimism in Model-Based Reinforcement Learning	Jun 21, 2020	continuous-controlContinuous Control	—Unverified
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees	Jun 20, 2020	OpenAI Gymreinforcement-learning	—Unverified
Accelerating Safe Reinforcement Learning with Constraint-mismatched Policies	Jun 20, 2020	Fairnessreinforcement-learning	—Unverified
Entropic Risk Constrained Soft-Robust Policy Optimization	Jun 20, 2020	reinforcement-learningReinforcement Learning	—Unverified
Langevin Dynamics for Adaptive Inverse Reinforcement Learning of Stochastic Gradient Algorithms	Jun 20, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learn to Earn: Enabling Coordination within a Ride Hailing Fleet	Jun 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Reinforcement Learning Approach for Transient Control of Liquid Rocket Engines	Jun 19, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified
NROWAN-DQN: A Stable Noisy Network with Noise Reduction and Online Weight Adjustment for Exploration	Jun 19, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
FISAR: Forward Invariant Safe Reinforcement Learning with a Deep Neural Network-Based Optimize	Jun 19, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
On Reward-Free Reinforcement Learning with Linear Function Approximation	Jun 19, 2020	reinforcement-learningReinforcement Learning	—Unverified
Provably adaptive reinforcement learning in metric spaces	Jun 18, 2020	reinforcement-learningReinforcement Learning	—Unverified
WD3: Taming the Estimation Bias in Deep Reinforcement Learning	Jun 18, 2020	continuous-controlContinuous Control	—Unverified
FLAMBE: Structural Complexity and Representation Learning of Low Rank MDPs	Jun 18, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Efficient Ridesharing Dispatch Using Multi-Agent Reinforcement Learning	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Cooperative Multi-Agent Reinforcement Learning with Partial Observations	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Distributed Value Function Approximation for Collaborative Multi-Agent Reinforcement Learning	Jun 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Interactive Recommender System via Knowledge Graph-enhanced Reinforcement Learning	Jun 18, 2020	Decision MakingRecommendation Systems	—Unverified
Deep Reinforcement Learning amidst Lifelong Non-Stationarity	Jun 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning Controller for 3D Path-following and Collision Avoidance by Autonomous Underwater Vehicles	Jun 17, 2020	Collision AvoidanceDecision Making	—Unverified
Delta Schema Network in Model-based Reinforcement Learning	Jun 17, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Eco-Vehicular Edge Networks for Connected Transportation: A Distributed Multi-Agent Reinforcement Learning Approach	Jun 17, 2020	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
Introduction to Machine Learning for Accelerator Physics	Jun 17, 2020	BIG-bench Machine Learningregression	—Unverified
Green Simulation Assisted Reinforcement Learning with Model Risk for Biomanufacturing Learning and Control	Jun 17, 2020	Decision MakingModel-based Reinforcement Learning	CodeCode Available
Parameterized MDPs and Reinforcement Learning Problems -- A Maximum Entropy Principle Based Framework	Jun 17, 2020	Decision MakingQ-Learning	—Unverified

Show:10 25 50

← PrevPage 432 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified