Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9826–9850 of 15113 papers

Title	Date	Tasks	Status
Density-Based Bonuses on Learned Representations for Reward-Free Exploration in Deep Reinforcement Learning	Jun 13, 2021	Deep Reinforcement LearningDensity Estimation	—Unverified
Density Constrained Reinforcement Learning	Jun 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
Dependency-Aware Computation Offloading in Mobile Edge Computing: A Reinforcement Learning Approach	Sep 18, 2019	Cloud ComputingEdge-computing	—Unverified
Dependency Parsing with Backtracking using Deep Reinforcement Learning	Jun 28, 2022	Deep Reinforcement LearningDependency Parsing	—Unverified
Depending on yourself when you should: Mentoring LLM with RL agents to become the master in cybersecurity games	Mar 26, 2024	Reinforcement Learning (RL)	—Unverified
Deploying Offline Reinforcement Learning with Human Feedback	Mar 13, 2023	Decision MakingModel Selection	—Unverified
Deploying Reinforcement Learning in Water Transport	Dec 14, 2020	Q-Learningreinforcement-learning	—Unverified
Depth and nonlinearity induce implicit exploration for RL	May 29, 2018	Q-Learningreinforcement-learning	—Unverified
Depth-Constrained ASV Navigation with Deep RL and Limited Sensing	Apr 25, 2025	Decision MakingReinforcement Learning (RL)	—Unverified
Depth-CUPRL: Depth-Imaged Contrastive Unsupervised Prioritized Representations in Reinforcement Learning for Mapless Navigation of Unmanned Aerial Vehicles	Jun 30, 2022	continuous-controlContinuous Control	—Unverified
Depthwise Convolution for Multi-Agent Communication with Enhanced Mean-Field Approximation	Mar 6, 2022	Reinforcement Learning (RL)SMAC	—Unverified
Derivative-Free Policy Optimization for Linear Risk-Sensitive and Robust Control Design: Implicit Regularization and Sample Complexity	Jan 4, 2021	continuous-controlContinuous Control	—Unverified
Derivative-Free Reinforcement Learning: A Review	Feb 10, 2021	Model Selectionreinforcement-learning	—Unverified
Description Based Text Classification with Reinforcement Learning	Feb 8, 2020	ClassificationGeneral Classification	—Unverified
Design and Comparison of Reward Functions in Reinforcement Learning for Energy Management of Sensor Nodes	Jun 2, 2021	energy managementManagement	—Unverified
Design and Development of Spoken Dialogue System in Indic Languages	Dec 1, 2021	Dialogue GenerationReinforcement Learning (RL)	—Unverified
Design and Experimental Test of Datatic Approximate Optimal Filter in Nonlinear Dynamic Systems	May 11, 2025	Computational EfficiencyReinforcement Learning (RL)	—Unverified
Design and Planning of Flexible Mobile Micro-Grids Using Deep Reinforcement Learning	Dec 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Design for a Darwinian Brain: Part 2. Cognitive Architecture	Mar 28, 2013	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Designing a Multi-Objective Reward Function for Creating Teams of Robotic Bodyguards Using Deep Reinforcement Learning	Jan 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Designing a Prospective COVID-19 Therapeutic with Reinforcement Learning	Dec 3, 2020	Deep Reinforcement LearningProtein Design	—Unverified
Designing Biological Sequences via Meta-Reinforcement Learning and Bayesian Optimization	Sep 13, 2022	Bayesian Optimizationglobal-optimization	—Unverified
Designing Composites with Target Effective Young's Modulus using Reinforcement Learning	Oct 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Designing Deep Reinforcement Learning for Human Parameter Exploration	Jul 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Designing high-fidelity multi-qubit gates for semiconductor quantum dots through deep reinforcement learning	Jun 15, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 394 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified