Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–3975 of 15113 papers

Title	Date	Tasks	Status
Derivative-Free Policy Optimization for Linear Risk-Sensitive and Robust Control Design: Implicit Regularization and Sample Complexity	Jan 4, 2021	continuous-controlContinuous Control	—Unverified
Derivative-Free Reinforcement Learning: A Review	Feb 10, 2021	Model Selectionreinforcement-learning	—Unverified
Description Based Text Classification with Reinforcement Learning	Feb 8, 2020	ClassificationGeneral Classification	—Unverified
Design and Comparison of Reward Functions in Reinforcement Learning for Energy Management of Sensor Nodes	Jun 2, 2021	energy managementManagement	—Unverified
Design and Development of Spoken Dialogue System in Indic Languages	Dec 1, 2021	Dialogue GenerationReinforcement Learning (RL)	—Unverified
Design and Experimental Test of Datatic Approximate Optimal Filter in Nonlinear Dynamic Systems	May 11, 2025	Computational EfficiencyReinforcement Learning (RL)	—Unverified
Coordinating Policies Among Multiple Agents via an Intelligent Communication Channel	May 21, 2022	Intelligent CommunicationMulti-agent Reinforcement Learning	—Unverified
Design and Planning of Flexible Mobile Micro-Grids Using Deep Reinforcement Learning	Dec 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Design for a Darwinian Brain: Part 2. Cognitive Architecture	Mar 28, 2013	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Designing a Multi-Objective Reward Function for Creating Teams of Robotic Bodyguards Using Deep Reinforcement Learning	Jan 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Designing a Prospective COVID-19 Therapeutic with Reinforcement Learning	Dec 3, 2020	Deep Reinforcement LearningProtein Design	—Unverified
Designing Biological Sequences via Meta-Reinforcement Learning and Bayesian Optimization	Sep 13, 2022	Bayesian Optimizationglobal-optimization	—Unverified
Designing Composites with Target Effective Young's Modulus using Reinforcement Learning	Oct 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Designing Deep Reinforcement Learning for Human Parameter Exploration	Jul 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Designing high-fidelity multi-qubit gates for semiconductor quantum dots through deep reinforcement learning	Jun 15, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Designing Interpretable Approximations to Deep Reinforcement Learning	Oct 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Coordinating Disaster Emergency Response with Heuristic Reinforcement Learning	Nov 12, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Designing Optimal Dynamic Treatment Regimes: A Causal Reinforcement Learning Approach	Jan 1, 2020	Decision Makingreinforcement-learning	—Unverified
Designing realistic RL environment for power systems	Jan 17, 2022	Reinforcement Learning (RL)	—Unverified
BATS: Best Action Trajectory Stitching	Apr 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
Designing Rewards for Fast Learning	May 30, 2022	Q-LearningReinforcement Learning (RL)	—Unverified
Design of Artificial Intelligence Agents for Games using Deep Reinforcement Learning	May 10, 2019	Deep Reinforcement LearningOpenAI Gym	—Unverified
A Generalized Projected Bellman Error for Off-policy Value Estimation in Reinforcement Learning	Apr 28, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Design of Interacting Particle Systems for Fast Linear Quadratic RL	Jun 16, 2024	Reinforcement Learning (RL)	—Unverified
ACTRCE: Augmenting Experience via Teacher's Advice For Multi-Goal Reinforcement Learning	Feb 12, 2019	Multi-Goal Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 159 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified