Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2150 of 15113 papers

Title	Date	Tasks	Status	Hype
Comparing Popular Simulation Environments in the Scope of Robotics and Reinforcement Learning	Mar 8, 2021	CPUreinforcement-learning	CodeCode Available	1
Compiler Optimization for Quantum Computing Using Reinforcement Learning	Dec 8, 2022	Compiler Optimizationreinforcement-learning	CodeCode Available	1
Compound AI Systems Optimization: A Survey of Methods, Challenges, and Future Directions	Jun 9, 2025	Reinforcement Learning (RL)	CodeCode Available	1
Critic-Guided Decoding for Controlled Text Generation	Dec 21, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
CROP: Conservative Reward for Model-based Offline Policy Optimization	Oct 26, 2023	D4RLOffline RL	CodeCode Available	1
CropGym: a Reinforcement Learning Environment for Crop Management	Apr 9, 2021	ManagementOpenAI Gym	CodeCode Available	1
Cross-Modal Contrastive Learning of Representations for Navigation using Lightweight, Low-Cost Millimeter Wave Radar for Adverse Environmental Conditions	Jan 10, 2021	Autonomous NavigationContrastive Learning	CodeCode Available	1
Cross-Modal Domain Adaptation for Reinforcement Learning	Jan 1, 2021	Domain AdaptationMuJoCo	CodeCode Available	1
Cross Modality 3D Navigation Using Reinforcement Learning and Neural Style Transfer	Nov 5, 2021	Computed Tomography (CT)Diagnostic	CodeCode Available	1
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity	Feb 14, 2019	continuous-controlContinuous Control	CodeCode Available	1
Communicative Reinforcement Learning Agents for Landmark Detection in Brain Images	Aug 18, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
CommonPower: A Framework for Safe Data-Driven Smart Grid Control	Jun 5, 2024	Benchmarkingenergy management	CodeCode Available	1
CURL: Contrastive Unsupervised Representation Learning for Reinforcement Learning	Jan 1, 2020	Contrastive Learningreinforcement-learning	CodeCode Available	1
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning	Jun 22, 2023	Data AugmentationOffline RL	CodeCode Available	1
Addressing Function Approximation Error in Actor-Critic Methods	Feb 26, 2018	Continuous ControlOpenAI Gym	CodeCode Available	1
Beyond Pick-and-Place: Tackling Robotic Stacking of Diverse Shapes	Oct 12, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Curriculum-based Reinforcement Learning for Distribution System Critical Load Restoration	Mar 8, 2022	Decision Makingreinforcement-learning	CodeCode Available	1
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1
Distributed Multi-Agent Reinforcement Learning with One-hop Neighbors and Compute Straggler Mitigation	Feb 18, 2022	Distributed ComputingMulti-agent Reinforcement Learning	CodeCode Available	1
DARTS: Differentiable Architecture Search	Jun 24, 2018	General Classificationimage-classification	CodeCode Available	1
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress	Jun 3, 2022	Atari GamesHumanoid Control	CodeCode Available	1
Data-Efficient Reinforcement Learning with Self-Predictive Representations	Jul 12, 2020	Atari Games 100kData Augmentation	CodeCode Available	1
Benchmarking Multi-Agent Deep Reinforcement Learning Algorithms in Cooperative Tasks	Jun 14, 2020	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
Reinforcement Learning for Combining Search Methods in the Calibration of Economic ABMs	Feb 23, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Beyond The Rainbow: High Performance Deep Reinforcement Learning on a Desktop PC	Nov 6, 2024	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets	Oct 6, 2023	D4RLDecision Making	CodeCode Available	1
Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging	Nov 17, 2020	Autonomous DrivingModel Predictive Control	CodeCode Available	1
Deceptive Path Planning via Reinforcement Learning with Graph Neural Networks	Feb 9, 2024	Graph Neural Networkreinforcement-learning	CodeCode Available	1
Combining Semantic Guidance and Deep Reinforcement Learning For Generating Human Level Paintings	Nov 25, 2020	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Decomposed Mutual Information Optimization for Generalized Context in Meta-Reinforcement Learning	Oct 9, 2022	Decision MakingMeta Reinforcement Learning	CodeCode Available	1
Decoupling Strategy and Generation in Negotiation Dialogues	Aug 29, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1
Decoupling Value and Policy for Generalization in Reinforcement Learning	Feb 20, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Actor-Critic Learning for Distributed Power Control in Wireless Mobile Networks	Sep 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Deep Intrinsically Motivated Exploration in Continuous Control	Oct 1, 2022	continuous-controlContinuous Control	CodeCode Available	1
A deep inverse reinforcement learning approach to route choice modeling with context-dependent rewards	Jun 18, 2022	Computational EfficiencyDemand Forecasting	CodeCode Available	1
Comparing Observation and Action Representations for Deep Reinforcement Learning in μRTS	Oct 26, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Bidirectional Model-based Policy Optimization	Jul 4, 2020	Decision Makingmodel	CodeCode Available	1
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1
Blockchain Framework for Artificial Intelligence Computation	Feb 23, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors	Jan 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Computational Performance of Deep Reinforcement Learning to find Nash Equilibria	Apr 26, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning to combine primitive skills: A step towards versatile robotic manipulation	Aug 2, 2019	Data AugmentationImitation Learning	CodeCode Available	1
Blue River Controls: A toolkit for Reinforcement Learning Control Systems on Hardware	Jan 7, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning based Recommendation with Explicit User-Item Interactions Modeling	Oct 29, 2018	Collaborative FilteringDecision Making	CodeCode Available	1
Deep Reinforcement Learning based Evasion Generative Adversarial Network for Botnet Detection	Oct 6, 2022	Deep Reinforcement LearningGenerative Adversarial Network	CodeCode Available	1
Deep Reinforcement Learning Control of Quantum Cartpoles	Oct 21, 2019	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for Cryptocurrency Trading: Practical Approach to Address Backtest Overfitting	Sep 12, 2022	Algorithmic TradingDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for Active Human Pose Estimation	Jan 7, 2020	3D Human Pose EstimationDeep Reinforcement Learning	CodeCode Available	1
Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow	Mar 26, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 43 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified