Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8701–8725 of 15113 papers

Title	Date	Tasks	Status
Reinforced Hybrid Genetic Algorithm for the Traveling Salesman Problem	Jul 9, 2021	DiversityQ-Learning	—Unverified
Offline reinforcement learning with uncertainty for treatment strategies in sepsis	Jul 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
Inferring Probabilistic Reward Machines from Non-Markovian Reward Processes for Reinforcement Learning	Jul 9, 2021	Decision Makingreinforcement-learning	—Unverified
Attend2Pack: Bin Packing through Deep Reinforcement Learning with Attention	Jul 9, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Interaction-aware Guidance Policies for Motion Planning in Dense Traffic Scenarios	Jul 9, 2021	Autonomous NavigationAutonomous Vehicles	—Unverified
Aligning an optical interferometer with beam divergence control and continuous action space	Jul 9, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Policy Gradient Methods for Distortion Risk Measures	Jul 9, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
CLAIM: Curriculum Learning Policy for Influence Maximization in Unknown Social Networks	Jul 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Stress Testing for Adversarial Learning in a Financial Environment	Jul 8, 2021	Fraud Detectionregression	—Unverified
Automated Gain Control Through Deep Reinforcement Learning for Downstream Radar Object Detection	Jul 8, 2021	Active LearningDeep Reinforcement Learning	—Unverified
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning	Jul 8, 2021	Gaussian ProcessesModel-based Reinforcement Learning	—Unverified
Enhancing Video Analytics Accuracy via Real-time Automated Camera Parameter Tuning	Jul 8, 2021	Face DetectionFace Recognition	—Unverified
Adaptation of Quadruped Robot Locomotion with Meta-Learning	Jul 8, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Computational Benefits of Intermediate Rewards for Goal-Reaching Policy Learning	Jul 8, 2021	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available
Sublinear Regret for Learning POMDPs	Jul 8, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Autonomous Pipeline Inspection with Hierarchical Reinforcement Learning	Jul 8, 2021	Autonomous NavigationDeep Reinforcement Learning	—Unverified
Quadruped Locomotion on Non-Rigid Terrain using Reinforcement Learning	Jul 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Pseudo-Model-Free Hedging for Variable Annuities via Deep Reinforcement Learning	Jul 7, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Federated Model Search via Reinforcement Learning	Jul 7, 2021	Federated LearningImage Classification	—Unverified
Learning Time-Invariant Reward Functions through Model-Based Inverse Reinforcement Learning	Jul 7, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
DORA: Toward Policy Optimization for Task-oriented Dialogue System with Efficient Context	Jul 7, 2021	Reinforcement Learning (RL)Task-Oriented Dialogue Systems	CodeCode Available
A Unified Off-Policy Evaluation Approach for General Value Function	Jul 6, 2021	Anomaly DetectionOff-policy evaluation	—Unverified
A Short Note on the Relationship of Information Gain and Eluder Dimension	Jul 6, 2021	LEMMAreinforcement-learning	—Unverified
Meta-Reinforcement Learning for Heuristic Planning	Jul 6, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
The Least Restriction for Offline Reinforcement Learning	Jul 5, 2021	Offline RLQ-Learning	—Unverified

Show:10 25 50

← PrevPage 349 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified