Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8276–8300 of 15113 papers

Title	Date	Tasks	Status	Hype
Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise Rollouts	May 7, 2021	Multi-agent Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Reward prediction for representation learning and reward shaping	May 7, 2021	PredictionReinforcement Learning (RL)	—Unverified	0
Deep Graph Convolutional Reinforcement Learning for Financial Portfolio Management -- DeepPocket	May 6, 2021	Managementreinforcement-learning	—Unverified	0
A Reinforcement Learning-based Economic Model Predictive Control Framework for Autonomous Operation of Chemical Reactors	May 6, 2021	Model Predictive Controlparameter estimation	—Unverified	0
Meta-Learning-Based Deep Reinforcement Learning for Multiobjective Optimization Problems	May 6, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Time-Aware Q-Networks: Resolving Temporal Irregularity for Deep Reinforcement Learning	May 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Safety Enhancement for Deep Reinforcement Learning in Autonomous Separation Assurance	May 5, 2021	Data AugmentationDeep Reinforcement Learning	—Unverified	0
Solving Sokoban with forward-backward reinforcement learning	May 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Survey on Multi-Agent Q-Learning frameworks for resource management in wireless sensor network	May 5, 2021	ManagementQ-Learning	—Unverified	0
UVIP: Model-Free Approach to Evaluate Reinforcement Learning Algorithms	May 5, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning Algorithms for Regenerative Stopping Problems with Applications to Shipping Consolidation in Logistics	May 5, 2021	Deep Reinforcement LearningImitation Learning	—Unverified	0
Reinforcement Learning for Scalable Logic Optimization with Graph Neural Networks	May 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
On the Linear convergence of Natural Policy Gradient Algorithm	May 4, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified	0
On Lottery Tickets and Minimal Task Representations in Deep Reinforcement Learning	May 4, 2021	Behavioural cloningDeep Reinforcement Learning	—Unverified	0
Data-Efficient Reinforcement Learning for Malaria Control	May 4, 2021	Decision MakingModel-based Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Adaptive Exploration of Unknown Environments	May 4, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Generative Adversarial Reward Learning for Generalized Behavior Tendency Inference	May 3, 2021	Recommendation Systemsreinforcement-learning	—Unverified	0
Learning swimming escape patterns for larval fish under energy constraints	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Reinforcement Learning for Air-to-Air Combat	May 3, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Robotic Surgery With Lean Reinforcement Learning	May 3, 2021	Q-Learningreinforcement-learning	CodeCode Available	0
RL-IoT: Reinforcement Learning to Interact with IoT Devices	May 3, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reinforcement Learning for Ridesharing: An Extended Survey	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement Learning	May 2, 2021	Graph AttentionInductive Learning	—Unverified	0
CARL-DTN: Context Adaptive Reinforcement Learning based Routing Algorithm in Delay Tolerant Network	May 2, 2021	Q-Learningreinforcement-learning	—Unverified	0
InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem	May 2, 2021	Atari GamesOffline RL	—Unverified	0

Show:10 25 50

← PrevPage 332 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified