Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12701–12750 of 15113 papers

Title	Date	Tasks	Status
Strongly-polynomial time and validation analysis of policy gradient methods	Sep 28, 2024	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Structural Credit Assignment in Neural Networks using Reinforcement Learning	Dec 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Structural Credit Assignment with Coordinated Exploration	Jul 25, 2023	Reinforcement Learning (RL)	—Unverified
Structural Return Maximization for Reinforcement Learning	May 12, 2014	Learning Theoryreinforcement-learning	—Unverified
Structural Similarity for Improved Transfer in Reinforcement Learning	Jul 27, 2022	Q-Learningreinforcement-learning	—Unverified
Structure-aware reinforcement learning for node-overload protection in mobile edge computing	Jun 29, 2021	Edge-computingreinforcement-learning	—Unverified
Structure-Aware Transformer Policy for Inhomogeneous Multi-Task Reinforcement Learning	Sep 29, 2021	Multi-Task Learningreinforcement-learning	—Unverified
Structured Dialogue Policy with Graph Neural Networks	Aug 1, 2018	Automatic Speech Recognition (ASR)Decision Making	—Unverified
Structured Graph Network for Constrained Robot Crowd Navigation with Low Fidelity Simulation	May 27, 2024	Reinforcement Learning (RL)	—Unverified
Structured Reinforcement Learning for Delay-Optimal Data Transmission in Dense mmWave Networks	Apr 25, 2024	FairnessMulti-Armed Bandits	—Unverified
Structured World Belief for Reinforcement Learning in POMDP	Jul 19, 2021	Inductive BiasObject	—Unverified
Structure-Enhanced Deep Reinforcement Learning for Optimal Transmission Scheduling	Nov 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Structure in Deep Reinforcement Learning: A Survey and Open Problems	Jun 28, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Structure Learning in Human Sequential Decision-Making	Dec 1, 2008	Decision Makingreinforcement-learning	—Unverified
Structure Learning in Motor Control:A Deep Reinforcement Learning Model	Jun 21, 2017	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Student/Teacher Advising through Reward Augmentation	Feb 7, 2020	General Reinforcement Learningreinforcement-learning	—Unverified
Student-Teacher Curriculum Learning via Reinforcement Learning: Predicting Hospital Inpatient Admission Location	Jul 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Stylistic Dialogue Generation via Information-Guided Reinforcement Learning Strategy	Apr 5, 2020	Dialogue Generationreinforcement-learning	—Unverified
Sub-domain Modelling for Dialogue Management with Hierarchical Reinforcement Learning	Jun 19, 2017	Dialogue ManagementHierarchical Reinforcement Learning	—Unverified
Subgoal-based Reward Shaping to Improve Efficiency in Reinforcement Learning	Apr 13, 2021	AI Agentreinforcement-learning	—Unverified
Subgoal Discovery Using a Free Energy Paradigm and State Aggregations	Dec 21, 2024	Reinforcement Learning (RL)Sequential Decision Making	—Unverified
Sub-Goal Trees -- a Framework for Goal-Based Reinforcement Learning	Feb 27, 2020	Motion Planningreinforcement-learning	—Unverified
Relative Entropy Regularized Policy Iteration	Dec 5, 2018	continuous-controlContinuous Control	CodeCode Available
Relay Policy Learning: Solving Long-Horizon Tasks via Imitation and Reinforcement Learning	Oct 25, 2019	Imitation Learningreinforcement-learning	CodeCode Available
Towards More Sample Efficiency in Reinforcement Learning with Data Augmentation	Oct 19, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available
Sequential memory improves sample and memory efficiency in Episodic Control	Dec 29, 2021	Deep Reinforcement LearningHippocampus	CodeCode Available
Understanding Multi-Step Deep Reinforcement Learning: A Systematic Study of the DQN Target	Jan 22, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
Proper Value Equivalence	Jun 18, 2021	Model-based Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Reliability and Learnability of Human Bandit Feedback for Sequence-to-Sequence Reinforcement Learning	May 27, 2018	Machine TranslationNMT	CodeCode Available
Sequential Recommendation for Optimizing Both Immediate Feedback and Long-term Retention	Apr 4, 2024	Contrastive LearningMulti-Task Learning	CodeCode Available
Meta-Reinforcement Learning via Buffering Graph Signatures for Live Video Streaming Events	Oct 3, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available
On the Effectiveness of Offline RL for Dialogue Response Generation	Jul 23, 2023	Offline RLreinforcement-learning	CodeCode Available
Relational Graph Learning for Crowd Navigation	Sep 28, 2019	Deep Reinforcement LearningGraph Learning	CodeCode Available
Relational Deep Reinforcement Learning	Jun 5, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
ReLAX: Reinforcement Learning Agent eXplainer for Arbitrary Predictive Models	Oct 22, 2021	counterfactualDecision Making	CodeCode Available
Task-Oriented Language Grounding for Language Input with Multiple Sub-Goals of Non-Linear Order	Oct 27, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Task-Oriented Query Reformulation with Reinforcement Learning	Apr 15, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Task Phasing: Automated Curriculum Learning from Demonstrations	Oct 20, 2022	Reinforcement Learning (RL)	CodeCode Available
UNSAT Solver Synthesis via Monte Carlo Forest Search	Nov 22, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures	Jul 1, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Remember and Forget for Experience Replay	Jul 16, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Value Iteration for Learning Concurrently Executable Robotic Control Tasks	Apr 1, 2025	Reinforcement Learning (RL)	CodeCode Available
Monolithic vs. hybrid controller for multi-objective Sim-to-Real learning	Aug 17, 2021	Reinforcement Learning (RL)	CodeCode Available
Value Iteration Networks	Feb 9, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
Renaissance Robot: Optimal Transport Policy Fusion for Learning Diverse Skills	Jul 3, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Propagating Uncertainty in Reinforcement Learning via Wasserstein Barycenters	Dec 1, 2019	Atari GamesQ-Learning	CodeCode Available
Model-based Offline Policy Optimization with Adversarial Network	Sep 5, 2023	modelOffline RL	CodeCode Available
Setting up a Reinforcement Learning Task with a Real-World Robot	Mar 19, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Monitored Markov Decision Processes	Feb 9, 2024	Reinforcement Learning (RL)	CodeCode Available
TD3 with Reverse KL Regularizer for Offline Reinforcement Learning from Mixed Datasets	Dec 5, 2022	D4RLMuJoCo	CodeCode Available

Show:10 25 50

← PrevPage 255 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified