Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6276–6300 of 15113 papers

Title	Date	Tasks	Status
Structure Learning in Human Sequential Decision-Making	Dec 1, 2008	Decision Makingreinforcement-learning	—Unverified
Structure Learning in Motor Control:A Deep Reinforcement Learning Model	Jun 21, 2017	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Student/Teacher Advising through Reward Augmentation	Feb 7, 2020	General Reinforcement Learningreinforcement-learning	—Unverified
Student-Teacher Curriculum Learning via Reinforcement Learning: Predicting Hospital Inpatient Admission Location	Jul 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Stylistic Dialogue Generation via Information-Guided Reinforcement Learning Strategy	Apr 5, 2020	Dialogue Generationreinforcement-learning	—Unverified
Sub-domain Modelling for Dialogue Management with Hierarchical Reinforcement Learning	Jun 19, 2017	Dialogue ManagementHierarchical Reinforcement Learning	—Unverified
Subgoal-based Reward Shaping to Improve Efficiency in Reinforcement Learning	Apr 13, 2021	AI Agentreinforcement-learning	—Unverified
Subgoal Discovery Using a Free Energy Paradigm and State Aggregations	Dec 21, 2024	Reinforcement Learning (RL)Sequential Decision Making	—Unverified
Sub-Goal Trees -- a Framework for Goal-Based Reinforcement Learning	Feb 27, 2020	Motion Planningreinforcement-learning	—Unverified
Sub-Goal Trees -- a Framework for Goal-Directed Trajectory Prediction and Optimization	Jun 12, 2019	Motion Planningreinforcement-learning	—Unverified
Detecting Small Query Graphs in A Large Graph via Neural Subgraph Search	Jul 21, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Subjective Reinforcement Learning for Open Complex Environments	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Sublinear Least-Squares Value Iteration via Locality Sensitive Hashing	May 18, 2021	reinforcement-learningReinforcement Learning	—Unverified
Sublinear Regret for a Class of Continuous-Time Linear-Quadratic Reinforcement Learning Problems	Jul 24, 2024	Reinforcement Learning (RL)	—Unverified
Sublinear Regret for Learning POMDPs	Jul 8, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Suboptimal and trait-like reinforcement learning strategies correlate with midbrain encoding of prediction errors	Dec 8, 2021	Reinforcement Learning (RL)	—Unverified
Sub-optimal Policy Aided Multi-Agent Reinforcement Learning for Flocking Control	Sep 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Sub-policy Adaptation for Hierarchical Reinforcement Learning	Jun 13, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
Sub-policy Adaptation for Hierarchical Reinforcement Learning	May 16, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
Subtask-Aware Visual Reward Learning from Segmented Demonstrations	Feb 28, 2025	Contrastive LearningReinforcement Learning (RL)	—Unverified
Sub-Task Discovery with Limited Supervision: A Constrained Clustering Approach	Mar 24, 2019	ClusteringConstrained Clustering	—Unverified
Successive Over Relaxation Q-Learning	Mar 9, 2019	Q-LearningReinforcement Learning	—Unverified
Successor Feature Neural Episodic Control	Nov 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Successor Features for Transfer in Reinforcement Learning	Jun 16, 2016	reinforcement-learningReinforcement Learning	—Unverified
Successor Features Combine Elements of Model-Free and Model-based Reinforcement Learning	Jan 31, 2019	Decision Makingmodel	—Unverified

Show:10 25 50

← PrevPage 252 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified