Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13051–13100 of 15113 papers

Title	Date	Tasks	Status
Magpie: Automatically Tuning Static Parameters for Distributed File Systems using Deep Reinforcement Learning	Jul 19, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
The Game of Tetris in Machine Learning	May 5, 2019	BIG-bench Machine Learningreinforcement-learning	CodeCode Available
Continuous Action Reinforcement Learning from a Mixture of Interpretable Experts	Jun 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Model-Based End-to-End Learning for WDM Systems With Transceiver Hardware Impairments	Nov 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Off-Policy Actor-Critic for Adversarial Observation Robustness: Virtual Alternative Training via Symmetric Policy Evaluation	Jun 20, 2025	Reinforcement Learning (RL)	CodeCode Available
Reinforcement Learning for Uplift Modeling	Nov 26, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Policy Constraint by Only Support Constraint for Offline Reinforcement Learning	Mar 7, 2025	Offline RLreinforcement-learning	CodeCode Available
Multi-view Disentanglement for Reinforcement Learning with Multiple Cameras	Apr 22, 2024	Disentanglementreinforcement-learning	CodeCode Available
Universal Value Density Estimation for Imitation Learning and Goal-Conditioned Reinforcement Learning	Feb 15, 2020	Density EstimationImitation Learning	CodeCode Available
Variational Delayed Policy Optimization	May 23, 2024	MuJoCoReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning for Topic Models	May 8, 2023	DiversityReinforcement Learning	CodeCode Available
SOLAR: Deep Structured Representations for Model-Based Reinforcement Learning	Aug 28, 2018	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
RLFlow: Optimising Neural Network Subgraph Transformation with World Models	May 3, 2022	Deep LearningModel-based Reinforcement Learning	CodeCode Available
Off-Policy Actor-Critic	May 22, 2012	reinforcement-learningReinforcement Learning	CodeCode Available
RL-GAN-Net: A Reinforcement Learning Agent Controlled GAN Network for Real-Time Point Cloud Shape Completion	Apr 28, 2019	Generative Adversarial NetworkReinforcement Learning	CodeCode Available
Offline Safe Reinforcement Learning Using Trajectory Classification	Dec 19, 2024	Classificationreinforcement-learning	CodeCode Available
RLgraph: Modular Computation Graphs for Deep Reinforcement Learning	Oct 21, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
VQC-Based Reinforcement Learning with Data Re-uploading: Performance and Trainability	Jan 21, 2024	Q-Learningreinforcement-learning	CodeCode Available
Training Adversarial Agents to Exploit Weaknesses in Deep Control Policies	Feb 27, 2020	Autonomous DrivingAutonomous Vehicles	CodeCode Available
Training Agents using Upside-Down Reinforcement Learning	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Multivariate Time Series Early Classification Across Channel and Time Dimensions	Jun 26, 2023	ClassificationEarly Classification	CodeCode Available
Lusifer: LLM-based User SImulated Feedback Environment for online Recommender systems	May 22, 2024	Collaborative FilteringRecommendation Systems	CodeCode Available
Reinforcement Learning for Solving the Vehicle Routing Problem	Feb 12, 2018	Combinatorial Optimizationreinforcement-learning	CodeCode Available
Training an Interactive Humanoid Robot Using Multimodal Deep Reinforcement Learning	Nov 26, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning for Solving Stochastic Vehicle Routing Problem	Nov 13, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Modular Deep Reinforcement Learning for Continuous Motion Planning with Temporal Logic	Feb 24, 2021	Deep Reinforcement LearningMotion Planning	CodeCode Available
Reinforcement Learning for Robot Navigation with Adaptive Forward Simulation Time (AFST) in a Semi-Markov Model	Aug 13, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning for Robotic Manipulation using Simulated Locomotion Demonstrations	Oct 16, 2019	Objectreinforcement-learning	CodeCode Available
Policy Consolidation for Continual Reinforcement Learning	Feb 1, 2019	Continual Learningcontinuous-control	CodeCode Available
Solving Common-Payoff Games with Approximate Policy Iteration	Jan 11, 2021	DecoderDeep Reinforcement Learning	CodeCode Available
Policy Augmentation: An Exploration Strategy for Faster Convergence of Deep Reinforcement Learning Algorithms	Feb 10, 2021	Deep Reinforcement LearningMatrix Completion	CodeCode Available
Variational Generative Stochastic Networks with Collaborative Shaping	Aug 2, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
RL-NCS: Reinforcement learning based data-driven approach for nonuniform compressed sensing	Jul 2, 2021	compressed sensingreinforcement-learning	CodeCode Available
Multi-timescale memory dynamics in a reinforcement learning network with attention-gated memory	Dec 28, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
POCE: Primal Policy Optimization with Conservative Estimation for Multi-constraint Offline Reinforcement Learning	Jan 1, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available
Reinforcement learning for Quantum Tiq-Taq-Toe	Nov 10, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
PlotMap: Automated Layout Design for Building Game Worlds	Sep 26, 2023	Decision MakingLayout Design	CodeCode Available
Reinforcement Learning for Portfolio Management	Sep 12, 2019	Data AugmentationManagement	CodeCode Available
Reinforcement Learning for Pivoting Task	Mar 1, 2017	continuous-controlContinuous Control	CodeCode Available
Offline RL with Smooth OOD Generalization in Convex Hull and its Neighborhood	Jun 10, 2025	Computational EfficiencyD4RL	CodeCode Available
RL-PGO: Reinforcement Learning-based Planar Pose-Graph Optimization	Feb 26, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning	Dec 4, 2018	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
RLPP: A Residual Method for Zero-Shot Real-World Autonomous Racing on Scaled Platforms	Jan 28, 2025	Autonomous RacingReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning for Physical Layer Communications	Jun 22, 2021	Deep Reinforcement LearningMulti-Armed Bandits	CodeCode Available
Reinforcement learning for multi-item retrieval in the puzzle-based storage system	Feb 5, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Multi-Timescale Ensemble Q-learning for Markov Decision Process Policy Optimization	Feb 8, 2024	Q-Learningreinforcement-learning	CodeCode Available
Modern Deep Reinforcement Learning Algorithms	Jun 24, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning for Market Making in a Multi-agent Dealer Market	Nov 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Offline Reinforcement Learning from Datasets with Structured Non-Stationarity	May 23, 2024	continuous-controlContinuous Control	CodeCode Available
RLScheduler: An Automated HPC Batch Job Scheduler Using Reinforcement Learning	Oct 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 262 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified