Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2800 of 15113 papers

Title	Date	Tasks	Status
Data-driven End-to-end Learning of Pole Placement Control for Nonlinear Dynamics via Koopman Invariant Subspaces	Aug 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Data-Assimilated Model-Based Reinforcement Learning for Partially Observed Chaotic Flows	Apr 23, 2025	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Lifetime Extended Energy Management Strategy for Fuel Cell Hybrid Electric Vehicles via Self-Learning Fuzzy Reinforcement Learning	Feb 13, 2023	energy managementManagement	—Unverified
Data-assimilated model-informed reinforcement learning	Jun 2, 2025	modelreinforcement-learning	—Unverified
Algorithms in Multi-Agent Systems: A Holistic Perspective from Reinforcement Learning and Game Theory	Jan 17, 2020	counterfactualDeep Reinforcement Learning	—Unverified
Automated Lane Change Strategy using Proximal Policy Optimization-based Deep Reinforcement Learning	Feb 7, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Primal-Dual Approach	Sep 13, 2021	Decision Makingreinforcement-learning	—Unverified
Data Augmentation for Continual RL via Adversarial Gradient Episodic Memory	Aug 24, 2024	BenchmarkingData Augmentation	—Unverified
Automated Lane Change Decision Making using Deep Reinforcement Learning in Dynamic and Uncertain Highway Environment	Sep 18, 2019	Autonomous DrivingDecision Making	—Unverified
Algorithms for Learning Markov Field Policies	Dec 1, 2012	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Energy Management for Real Driving Conditions via Transfer Reinforcement Learning	Jul 24, 2020	energy managementManagement	—Unverified
Automated Hybrid Reward Scheduling via Large Language Models for Robotic Skill Learning	May 5, 2025	Reinforcement Learning (RL)Scheduling	—Unverified
Automated Gain Control Through Deep Reinforcement Learning for Downstream Radar Object Detection	Jul 8, 2021	Active LearningDeep Reinforcement Learning	—Unverified
Algorithms for Batch Hierarchical Reinforcement Learning	Mar 29, 2016	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Achieving Tighter Finite-Time Rates for Heterogeneous Federated Stochastic Approximation under Markovian Sampling	Apr 15, 2025	Reinforcement Learning (RL)	—Unverified
Data Boost: Text Data Augmentation Through Reinforcement Learning Guided Conditional Generation	Dec 5, 2020	Data Augmentationreinforcement-learning	—Unverified
Algorithmic Trading Using Continuous Action Space Deep Reinforcement Learning	Oct 7, 2022	Algorithmic TradingDeep Reinforcement Learning	—Unverified
Automated Driving with Evolution Capability: A Reinforcement Learning Method with Monotonic Performance Enhancement	Dec 14, 2024	Decision Makingreinforcement-learning	—Unverified
DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning	Mar 13, 2022	Offline RLreinforcement-learning	—Unverified
Algorithmic Prompt Generation for Diverse Human-like Teaming and Communication with Large Language Models	Apr 4, 2025	Reinforcement Learning (RL)	—Unverified
Automated Discovery of Functional Actual Causes in Complex Environments	Apr 16, 2024	AttributeReinforcement Learning (RL)	—Unverified
Adaptive Droplet Routing in Digital Microfluidic Biochips Using Deep Reinforcement Learning	Jan 1, 2020	Deep Reinforcement LearningOpenAI Gym	—Unverified
Automated Design and Optimization of Distributed Filtering Circuits via Reinforcement Learning	Feb 22, 2024	CPUGPU	—Unverified
Automated Database Indexing using Model-free Reinforcement Learning	Jul 25, 2020	reinforcement-learningReinforcement Learning	—Unverified
Algorithmic Improvements for Deep Reinforcement Learning applied to Interactive Fiction	Nov 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Discretization in Online Reinforcement Learning	Oct 29, 2021	Managementreinforcement-learning	—Unverified
DAQN: Deep Auto-encoder and Q-Network	Jun 2, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data Center Cooling System Optimization Using Offline Reinforcement Learning	Jan 25, 2025	Graph Neural NetworkOffline RL	—Unverified
Automated Adversary Emulation for Cyber-Physical Systems via Reinforcement Learning	Nov 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
Algorithm Discovery With LLMs: Evolutionary Search Meets Reinforcement Learning	Apr 7, 2025	Combinatorial Optimizationreinforcement-learning	—Unverified
A Bandit Framework for Optimal Selection of Reinforcement Learning Agents	Feb 10, 2019	Deep Reinforcement LearningInductive Bias	—Unverified
Automata Guided Skill Composition	May 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Automata Guided Reinforcement Learning With Demonstrations	Sep 17, 2018	reinforcement-learningReinforcement Learning	—Unverified
AlgoPilot: Fully Autonomous Program Synthesis Without Human-Written Programs	Jan 11, 2025	Language ModelingLanguage Modelling	—Unverified
Human-Robot Collaboration via Deep Reinforcement Learning of Real-World Interactions	Dec 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
AUTOMATA GUIDED HIERARCHICAL REINFORCEMENT LEARNING FOR ZERO-SHOT SKILL COMPOSITION	Jan 1, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Automata-Guided Hierarchical Reinforcement Learning for Skill Composition	Oct 31, 2017	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
AlgaeDICE: Policy Gradient from Arbitrary Experience	Dec 4, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for DNN Workloads	Jul 8, 2020	Deep LearningEfficient Exploration	—Unverified
AutoHAS: Efficient Hyperparameter and Architecture Search	Jun 5, 2020	AutoMLHyperparameter Optimization	—Unverified
Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device	Dec 26, 2020	3D Object DetectionAutonomous Driving	—Unverified
Dantzig Selector with an Approximately Optimal Denoising Matrix and its Application to Reinforcement Learning	Nov 2, 2018	compressed sensingDenoising	—Unverified
Auto Graph Encoder-Decoder for Neural Network Pruning	Nov 25, 2020	DecoderModel Compression	—Unverified
Policy Zooming: Adaptive Discretization-based Infinite-Horizon Average-Reward Reinforcement Learning	May 29, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
DADI: Dynamic Discovery of Fair Information with Adversarial Reinforcement Learning	Oct 30, 2019	Fairnessreinforcement-learning	—Unverified
Uniform Last-Iterate Guarantee for Bandits and Reinforcement Learning	Feb 20, 2024	reinforcement-learningReinforcement Learning	—Unverified
A Learning Framework for High Precision Industrial Assembly	Sep 23, 2018	reinforcement-learningReinforcement Learning	—Unverified
DACOM: Learning Delay-Aware Communication for Multi-Agent Reinforcement Learning	Dec 3, 2022	Autonomous DrivingMulti-agent Reinforcement Learning	—Unverified
Damped Anderson Mixing for Deep Reinforcement Learning: Acceleration, Convergence, and Stabilization	Oct 17, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Auto-FedRL: Federated Hyperparameter Optimization for Multi-institutional Medical Image Segmentation	Mar 12, 2022	Federated LearningHyperparameter Optimization	—Unverified

Show:10 25 50

← PrevPage 56 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified