Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2776–2800 of 15113 papers

Title	Date	Tasks	Status
Adaptive Discretization in Online Reinforcement Learning	Oct 29, 2021	Managementreinforcement-learning	—Unverified
DAQN: Deep Auto-encoder and Q-Network	Jun 2, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data Center Cooling System Optimization Using Offline Reinforcement Learning	Jan 25, 2025	Graph Neural NetworkOffline RL	—Unverified
Automated Adversary Emulation for Cyber-Physical Systems via Reinforcement Learning	Nov 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
Algorithm Discovery With LLMs: Evolutionary Search Meets Reinforcement Learning	Apr 7, 2025	Combinatorial Optimizationreinforcement-learning	—Unverified
A Bandit Framework for Optimal Selection of Reinforcement Learning Agents	Feb 10, 2019	Deep Reinforcement LearningInductive Bias	—Unverified
Automata Guided Skill Composition	May 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Automata Guided Reinforcement Learning With Demonstrations	Sep 17, 2018	reinforcement-learningReinforcement Learning	—Unverified
AlgoPilot: Fully Autonomous Program Synthesis Without Human-Written Programs	Jan 11, 2025	Language ModelingLanguage Modelling	—Unverified
Human-Robot Collaboration via Deep Reinforcement Learning of Real-World Interactions	Dec 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
AUTOMATA GUIDED HIERARCHICAL REINFORCEMENT LEARNING FOR ZERO-SHOT SKILL COMPOSITION	Jan 1, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Automata-Guided Hierarchical Reinforcement Learning for Skill Composition	Oct 31, 2017	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
AlgaeDICE: Policy Gradient from Arbitrary Experience	Dec 4, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for DNN Workloads	Jul 8, 2020	Deep LearningEfficient Exploration	—Unverified
AutoHAS: Efficient Hyperparameter and Architecture Search	Jun 5, 2020	AutoMLHyperparameter Optimization	—Unverified
Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device	Dec 26, 2020	3D Object DetectionAutonomous Driving	—Unverified
Dantzig Selector with an Approximately Optimal Denoising Matrix and its Application to Reinforcement Learning	Nov 2, 2018	compressed sensingDenoising	—Unverified
Auto Graph Encoder-Decoder for Neural Network Pruning	Nov 25, 2020	DecoderModel Compression	—Unverified
Policy Zooming: Adaptive Discretization-based Infinite-Horizon Average-Reward Reinforcement Learning	May 29, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
DADI: Dynamic Discovery of Fair Information with Adversarial Reinforcement Learning	Oct 30, 2019	Fairnessreinforcement-learning	—Unverified
Uniform Last-Iterate Guarantee for Bandits and Reinforcement Learning	Feb 20, 2024	reinforcement-learningReinforcement Learning	—Unverified
A Learning Framework for High Precision Industrial Assembly	Sep 23, 2018	reinforcement-learningReinforcement Learning	—Unverified
DACOM: Learning Delay-Aware Communication for Multi-Agent Reinforcement Learning	Dec 3, 2022	Autonomous DrivingMulti-agent Reinforcement Learning	—Unverified
Damped Anderson Mixing for Deep Reinforcement Learning: Acceleration, Convergence, and Stabilization	Oct 17, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Auto-FedRL: Federated Hyperparameter Optimization for Multi-institutional Medical Image Segmentation	Mar 12, 2022	Federated LearningHyperparameter Optimization	—Unverified

Show:10 25 50

← PrevPage 112 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified