Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14051–14100 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning for Tactile Robotics: Learning to Type on a Braille Keyboard	Aug 6, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Adaptive coordination of working-memory and reinforcement learning in non-human primates performing a trial-and-error problem solving task	Nov 2, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning for Swarm Systems	Jul 17, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available
Learning to Drive in a Day	Jul 1, 2018	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available
Computational Benefits of Intermediate Rewards for Goal-Reaching Policy Learning	Jul 8, 2021	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available
Deep Reinforcement Learning for Surgical Gesture Segmentation and Classification	Jun 21, 2018	Action SegmentationClassification	CodeCode Available
Distinguishing Learning Rules with Brain Machine Interfaces	Jun 27, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
ALBA : Reinforcement Learning for Video Object Segmentation	May 26, 2020	ObjectOne-shot visual object segmentation	CodeCode Available
Compositional Learning of Visually-Grounded Concepts Using Reinforcement	Sep 8, 2023	Deep Reinforcement LearningNavigate	CodeCode Available
A Laplacian Framework for Option Discovery in Reinforcement Learning	Mar 2, 2017	Atari Gamesreinforcement-learning	CodeCode Available
Compositional Conservatism: A Transductive Approach in Offline Reinforcement Learning	Apr 6, 2024	D4RLOffline RL	CodeCode Available
Deep reinforcement learning for smart calibration of radio telescopes	Feb 5, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Constrained Policy Optimization with Explicit Behavior Density for Offline Reinforcement Learning	Jan 28, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Large Language Model-Driven Curriculum Design for Mobile Networks	May 28, 2024	Language ModelingLanguage Modelling	CodeCode Available
Leveraging Approximate Model-based Shielding for Probabilistic Safety Guarantees in Continuous Environments	Feb 1, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available
Composable Deep Reinforcement Learning for Robotic Manipulation	Mar 19, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available
How Are Learned Perception-Based Controllers Impacted by the Limits of Robust Control?	Apr 2, 2021	Reinforcement Learning (RL)	CodeCode Available
Learning model-based strategies in simple environments with hierarchical q-networks	Jan 20, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Automated Optical Multi-layer Design via Deep Reinforcement Learning	Jun 21, 2020	Deep Reinforcement LearningPhysical Intuition	CodeCode Available
Automated Image Data Preprocessing with Deep Reinforcement Learning	Jun 15, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
A Kernel Loss for Solving the Bellman Equation	May 25, 2019	Q-LearningReinforcement Learning	CodeCode Available
Feudal Graph Reinforcement Learning	Apr 11, 2023	Decision MakingGraph Clustering	CodeCode Available
Distributed Deep Reinforcement Learning: Learn how to play Atari games in 21 minutes	Jan 9, 2018	Atari GamesCPU	CodeCode Available
Distributed Distributional Deterministic Policy Gradients	Apr 23, 2018	continuous-controlContinuous Control	CodeCode Available
Answers Unite! Unsupervised Metrics for Reinforced Summarization Models	Sep 4, 2019	Abstractive Text SummarizationQuestion Answering	CodeCode Available
Large Language Models are Autonomous Cyber Defenders	May 7, 2025	Reinforcement Learning (RL)	CodeCode Available
FeUdal Networks for Hierarchical Reinforcement Learning	Mar 3, 2017	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Sepsis Treatment	Nov 27, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available
Large Language Models are Biased Reinforcement Learners	May 19, 2024	Decision MakingIn-Context Learning	CodeCode Available
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available
Automated Gadget Discovery in Science	Dec 24, 2022	ClusteringReinforcement Learning (RL)	CodeCode Available
Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL	May 26, 2025	D4RLOffline RL	CodeCode Available
Complex Model Transformations by Reinforcement Learning with Uncertain Human Guidance	Jun 25, 2025	Reinforcement Learning (RL)	CodeCode Available
How Helpful is Inverse Reinforcement Learning for Table-to-Text Generation?	Aug 1, 2021	Domain AdaptationHallucination	CodeCode Available
Deep Reinforcement Learning for Programming Language Correction	Jan 31, 2018	Deep Reinforcement LearningMachine Translation	CodeCode Available
Few-Shot Image-to-Semantics Translation for Policy Transfer in Reinforcement Learning	Jan 31, 2023	Active LearningComputational Efficiency	CodeCode Available
How Many Random Seeds? Statistical Power Analysis in Deep Reinforcement Learning Experiments	Jun 21, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Long-Short Portfolio Optimization	Dec 26, 2020	Deep Reinforcement LearningManagement	CodeCode Available
Distributed Reinforcement Learning for Decentralized Linear Quadratic Control: A Derivative-Free Policy Optimization Approach	Dec 19, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
A novel policy for pre-trained Deep Reinforcement Learning for Speech Emotion Recognition	Jan 4, 2021	Cross-corpusDeep Reinforcement Learning	CodeCode Available
A Joint Imitation-Reinforcement Learning Framework for Reduced Baseline Regret	Sep 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Interactive Learning from Activity Description	Feb 13, 2021	General Reinforcement LearningGrounded language learning	CodeCode Available
How Private Is Your RL Policy? An Inverse RL Based Analysis Framework	Dec 10, 2021	Adversarial AttackAutonomous Driving	CodeCode Available
Multi-Agent Reinforcement Learning in Stochastic Networked Systems	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Playing 2.5D Fighting Games	May 5, 2018	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Few-shot Quality-Diversity Optimization	Sep 14, 2021	DiversityMeta-Learning	CodeCode Available
How RL Agents Behave When Their Actions Are Modified	Feb 15, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Optimal Stopping with Application in Financial Engineering	May 19, 2021	Deep Reinforcement LearningQ-Learning	CodeCode Available
Distributed Soft Actor-Critic with Multivariate Reward Representation and Knowledge Distillation	Nov 29, 2019	Knowledge Distillationreinforcement-learning	CodeCode Available
FFNet: Video Fast-Forwarding via Reinforcement Learning	May 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 282 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified