Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7451–7500 of 15113 papers

Title	Date	Tasks	Status
FlexPool: A Distributed Model-Free Deep Reinforcement Learning Algorithm for Joint Passengers & Goods Transportation	Jul 27, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Flipping-based Policy for Chance-Constrained Markov Decision Processes	Oct 9, 2024	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning	Jun 26, 2025	Action GenerationDecision Making	—Unverified
Flow Navigation by Smart Microswimmers via Reinforcement Learning	Jan 30, 2017	Navigatereinforcement-learning	—Unverified
Flow Rate Control in Smart District Heating Systems Using Deep Reinforcement Learning	Dec 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Flow Shape Design for Microfluidic Devices Using Deep Reinforcement Learning	Nov 29, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Flowsheet synthesis through hierarchical reinforcement learning and graph neural networks	Jul 25, 2022	Chemical ProcessDecision Making	—Unverified
Flow to Control: Offline Reinforcement Learning with Lossless Primitive Discovery	Dec 2, 2022	D4RLreinforcement-learning	—Unverified
Floyd-Warshall Reinforcement Learning: Learning from Past Experiences to Reach New Goals	Sep 25, 2018	Q-Learningreinforcement-learning	—Unverified
Fly, Fail, Fix: Iterative Game Repair with Reinforcement Learning and Large Multimodal Models	Jul 16, 2025	Game DesignReinforcement Learning (RL)	—Unverified
FNAS: Uncertainty-Aware Fast Neural Architecture Search	May 25, 2021	FairnessGPU	—Unverified
Focus On What Matters: Separated Models For Visual-Based RL Generalization	Sep 29, 2024	Image ReconstructionReinforcement Learning (RL)	—Unverified
FoldingZero: Protein Folding from Scratch in Hydrophobic-Polar Model	Dec 3, 2018	Deep Reinforcement LearningProtein Folding	—Unverified
Following Instructions by Imagining and Reaching Visual Goals	Jan 25, 2020	Instruction FollowingReinforcement Learning	—Unverified
FollowNet: Robot Navigation by Following Natural Language Directions with Deep Reinforcement Learning	May 16, 2018	Deep Reinforcement LearningNavigate	—Unverified
Follow the Soldiers with Optimized Single-Shot Multibox Detection and Reinforcement Learning	Aug 2, 2023	object-detectionObject Detection	—Unverified
Follow your Nose: Using General Value Functions for Directed Exploration in Reinforcement Learning	Mar 2, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Forecaster-aided User Association and Load Balancing in Multi-band Mobile Networks	Jan 23, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Foresight of Graph Reinforcement Learning Latent Permutations Learnt by Gumbel Sinkhorn Network	Oct 23, 2021	Graph Attentionreinforcement-learning	—Unverified
Forethought and Hindsight in Credit Assignment	Oct 26, 2020	Reinforcement Learning (RL)	—Unverified
Formal Controller Synthesis for Continuous-Space MDPs via Model-Free Reinforcement Learning	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Formalising the Foundations of Discrete Reinforcement Learning in Isabelle/HOL	Dec 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
Formal Policy Synthesis for Continuous-Space Systems via Reinforcement Learning	May 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Formula RL: Deep Reinforcement Learning for Autonomous Racing using Telemetry Data	Apr 22, 2021	Autonomous RacingDeep Reinforcement Learning	—Unverified
Formulation and validation of a car-following model based on deep reinforcement learning	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Formulation of Deep Reinforcement Learning Architecture Toward Autonomous Driving for On-Ramp Merge	Sep 7, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified
For Pre-Trained Vision Models in Motor Control, Not All Policy Learning Methods are Created Equal	Apr 10, 2023	AllImitation Learning	—Unverified
Fortune: Formula-Driven Reinforcement Learning for Symbolic Table Reasoning in Language Models	May 29, 2025	Question AnsweringReinforcement Learning (RL)	—Unverified
Forward-Backward Reinforcement Learning	Mar 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
Forward KL Regularized Preference Optimization for Aligning Diffusion Policies	Sep 9, 2024	D4RLDecision Making	—Unverified
FOSP: Fine-tuning Offline Safe Policy through World Models	Jul 6, 2024	Model-based Reinforcement LearningOffline RL	—Unverified
Foundation Models for Semantic Novelty in Reinforcement Learning	Nov 9, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own	Oct 4, 2023	Quantizationreinforcement-learning	—Unverified
Foundations for Transfer in Reinforcement Learning: A Taxonomy of Knowledge Modalities	Dec 4, 2023	Computational Efficiencyreinforcement-learning	—Unverified
Foundations of Multivariate Distributional Reinforcement Learning	Aug 31, 2024	Decision MakingDistributional Reinforcement Learning	—Unverified
Fourier Policy Gradients	Feb 19, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Fox in the Henhouse: Supply-Chain Backdoor Attacks Against Reinforcement Learning	May 26, 2025	Reinforcement Learning (RL)	—Unverified
FPGA-Based Neural Thrust Controller for UAVs	Mar 27, 2024	Reinforcement Learning (RL)	—Unverified
FPGA Divide-and-Conquer Placement using Deep Reinforcement Learning	Apr 11, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
f-Policy Gradients: A General Framework for Goal Conditioned RL using f-Divergences	Oct 10, 2023	Efficient ExplorationPolicy Gradient Methods	—Unverified
Fractal Landscapes in Policy Optimization	Oct 24, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Fractional Deep Reinforcement Learning for Age-Minimal Mobile Edge Computing	Dec 16, 2023	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Fractional Transfer Learning for Deep Model-Based Reinforcement Learning	Aug 14, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Fragment-based Sequential Translation for Molecular Optimization	Oct 26, 2021	Drug DiscoveryReinforcement Learning (RL)	—Unverified
FrameHopper: Selective Processing of Video Frames in Detection-driven Real-Time Video Analytics	Mar 22, 2022	object-detectionObject Detection	—Unverified
Framework of Automatic Text Summarization Using Reinforcement Learning	Jul 1, 2012	Document SummarizationMulti-Document Summarization	—Unverified
Free^2Guide: Gradient-Free Path Integral Control for Enhancing Text-to-Video Generation with Large Vision-Language Models	Nov 26, 2024	Reinforcement Learning (RL)Text-to-Video Generation	—Unverified
Free Energy Projective Simulation (FEPS): Active inference with interpretability	Nov 22, 2024	Reinforcement Learning (RL)State Estimation	—Unverified
FreeKD: Free-direction Knowledge Distillation for Graph Neural Networks	Jun 14, 2022	Knowledge Distillationreinforcement-learning	—Unverified
Freeway Merging in Congested Traffic based on Multipolicy Decision Making with Passive Actor Critic	Jul 14, 2017	Decision Makingreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 150 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified