Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2801–2825 of 15113 papers

Title	Date	Tasks	Status
Auto-FedRL: Federated Hyperparameter Optimization for Multi-institutional Medical Image Segmentation	Mar 12, 2022	Federated LearningHyperparameter Optimization	—Unverified
Auto-Encoding Inverse Reinforcement Learning	Sep 29, 2021	Decision MakingImitation Learning	—Unverified
A Learning-Exploring Method to Generate Diverse Paraphrases with Multi-Objective Deep Reinforcement Learning	Dec 1, 2020	Deep Reinforcement LearningDiversity	—Unverified
Auto-Encoding Adversarial Imitation Learning	Jun 22, 2022	Decision MakingImitation Learning	—Unverified
Autoencoder-augmented Neuroevolution for Visual Doom Playing	Jul 12, 2017	reinforcement-learningReinforcement Learning	—Unverified
A Learning based Branch and Bound for Maximum Common Subgraph Problems	May 15, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Discrete Communication Bottlenecks with Dynamic Vector Quantization	Feb 2, 2022	Quantizationreinforcement-learning	—Unverified
Data-Driven LQR using Reinforcement Learning and Quadratic Neural Networks	Nov 16, 2023	reinforcement-learningReinforcement Learning	—Unverified
Data-driven Model Predictive and Reinforcement Learning Based Control for Building Energy Management: a Survey	Jun 28, 2021	energy managementManagement	—Unverified
Data efficient reinforcement learning and adaptive optimal perimeter control of network traffic dynamics	Sep 13, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
AutoEG: Automated Experience Grafting for Off-Policy Deep Reinforcement Learning	Apr 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
AutoDOViz: Human-Centered Automation for Decision Optimization	Feb 19, 2023	AutoMLreinforcement-learning	—Unverified
A Learned Simulation Environment to Model Student Engagement and Retention in Automated Online Courses	Dec 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure	Jul 8, 2018	reinforcement-learningReinforcement Learning	—Unverified
AutoCost: Evolving Intrinsic Cost for Zero-violation Reinforcement Learning	Jan 24, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Learned Simulation Environment to Model Plant Growth in Indoor Farming	Dec 6, 2022	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Discounting of Training Time Attacks	Jan 5, 2024	Reinforcement Learning (RL)	—Unverified
Auto-COP: Adaptation Generation in Context-Oriented Programming using Reinforcement Learning Options	Mar 11, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning	Jun 1, 2023	FairnessOffline RL	—Unverified
Auto-Agent-Distiller: Towards Efficient Deep Reinforcement Learning Agents via Neural Architecture Search	Dec 24, 2020	Deep Reinforcement LearningNeural Architecture Search	—Unverified
A User Study on Explainable Online Reinforcement Learning for Adaptive Systems	Jul 9, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
A bandit approach to curriculum generation for automatic speech recognition	Feb 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data-driven Dynamic Multi-objective Optimal Control: An Aspiration-satisfying Reinforcement Learning Approach	May 14, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Adaptive Dialog Policy Learning with Hindsight and User Modeling	May 7, 2020	Reinforcement Learning (RL)	—Unverified
A Unifying View of Optimism in Episodic Reinforcement Learning	Jul 3, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 113 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified