Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4951–5000 of 15113 papers

Title	Date	Tasks	Status
Asking the Difficult Questions: Goal-Oriented Visual Question Generation via Intermediate Rewards	Nov 21, 2017	Deep Reinforcement LearningInformativeness	—Unverified
A Sliding-Window Algorithm for Markov Decision Processes with Arbitrarily Changing Rewards and Transitions	May 25, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Socially Aware Reinforcement Learning Agent for The Single Track Road Problem	Sep 12, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Aspect and Opinion Aware Abstractive Review Summarization with Reinforced Hard Typed Decoder	Apr 13, 2020	Decoderreinforcement-learning	—Unverified
Aspect-based Sentiment Classification via Reinforcement Learning	Jan 1, 2021	ClassificationGeneral Classification	—Unverified
A Spiking Binary Neuron -- Detector of Causal Links	Sep 15, 2023	Reinforcement Learning (RL)	—Unverified
A Spiking Neural Network Learning Markov Chain	Sep 20, 2022	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Spiking Neural Network Structure Implementing Reinforcement Learning	Apr 9, 2022	reinforcement-learningReinforcement Learning	—Unverified
ASPiRe:Adaptive Skill Priors for Reinforcement Learning	Sep 30, 2022	reinforcement-learningReinforcement Learning	—Unverified
Transferable Cost-Aware Security Policy Implementation for Malware Detection Using Deep Reinforcement Learning	May 25, 2019	Deep Reinforcement LearningMalware Detection	—Unverified
ASQ-IT: Interactive Explanations for Reinforcement-Learning Agents	Jan 24, 2023	reinforcement-learningReinforcement Learning	—Unverified
Assembly robots with optimized control stiffness through reinforcement learning	Feb 27, 2020	reinforcement-learningReinforcement Learning	—Unverified
Assessing and Accelerating Coverage in Deep Reinforcement Learning	Dec 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Assessing Deep Reinforcement Learning Policies via Natural Corruptions at the Edge of Imperceptibility	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Assessing Evolutionary Terrain Generation Methods for Curriculum Reinforcement Learning	Mar 29, 2022	reinforcement-learningReinforcement Learning	—Unverified
Assessing Generalization in TD methods for Deep Reinforcement Learning	Sep 25, 2019	Deep Reinforcement LearningMemorization	—Unverified
Assessing Human Interaction in Virtual Reality With Continually Learning Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study	Dec 14, 2021	Continual LearningReinforcement Learning (RL)	—Unverified
Assessing Policy, Loss and Planning Combinations in Reinforcement Learning using a New Modular Architecture	Jan 8, 2022	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Assessing the Impact of Distribution Shift on Reinforcement Learning Performance	Feb 5, 2024	reinforcement-learningReinforcement Learning	—Unverified
Assessing the Zero-Shot Capabilities of LLMs for Action Evaluation in RL	Sep 19, 2024	Reinforcement Learning (RL)	—Unverified
Assessing Transferability from Simulation to Reality for Reinforcement Learning	Jul 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
Assessment of Reinforcement Learning Algorithms for Nuclear Power Plant Fuel Optimization	May 9, 2023	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Assessment of Reward Functions in Reinforcement Learning for Multi-Modal Urban Traffic Control under Real-World limitations	Oct 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Associative Memory Based Experience Replay for Deep Reinforcement Learning	Jul 16, 2022	CPUDeep Reinforcement Learning	—Unverified
Assume-Guarantee Reinforcement Learning	Dec 15, 2023	reinforcement-learningReinforcement Learning	—Unverified
Assured Learning-enabled Autonomy: A Metacognitive Reinforcement Learning Framework	Mar 23, 2021	Decision Makingreinforcement-learning	—Unverified
Assured RL: Reinforcement Learning with Almost Sure Constraints	Dec 24, 2020	Q-Learningreinforcement-learning	—Unverified
A stabilizing reinforcement learning approach for sampled systems with partially unknown models	Aug 31, 2022	reinforcement-learningReinforcement Learning	—Unverified
A State Aggregation Approach for Solving Knapsack Problem with Deep Reinforcement Learning	Apr 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A State Augmentation based approach to Reinforcement Learning from Human Preferences	Feb 17, 2023	reinforcement-learningReinforcement Learning	—Unverified
A State Representation Dueling Network for Deep Reinforcement Learning	Dec 24, 2020	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified
A State Representation for Diminishing Rewards	Sep 7, 2023	Reinforcement Learning (RL)	—Unverified
A statistical learning strategy for closed-loop control of fluid flows	Apr 11, 2016	reinforcement-learningReinforcement Learning	—Unverified
A Stochastic Composite Augmented Lagrangian Method For Reinforcement Learning	May 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A physics-informed reinforcement learning approach for the interfacial area transport in two-phase flow	Aug 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Strong Baseline for Batch Imitation Learning	Feb 6, 2023	continuous-controlContinuous Control	—Unverified
A Structure-aware Online Learning Algorithm for Markov Decision Processes	Nov 28, 2018	ManagementReinforcement Learning	—Unverified
A Study of AI Population Dynamics with Million-agent Reinforcement Learning	Sep 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Study of Continual Learning Methods for Q-Learning	Jun 8, 2022	Continual LearningQ-Learning	—Unverified
A study of first-passage time minimization via Q-learning in heated gridworlds	Oct 5, 2021	Q-Learningreinforcement-learning	—Unverified
A Study of State Aliasing in Structured Prediction with RNNs	Jun 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Study on Dense and Sparse (Visual) Rewards in Robot Policy Learning	Aug 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Subgame Perfect Equilibrium Reinforcement Learning Approach to Time-inconsistent Problems	Oct 27, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Succinct Summary of Reinforcement Learning	Jan 3, 2023	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A SUMO Framework for Deep Reinforcement Learning Experiments Solving Electric Vehicle Charging Dispatching Problem	Sep 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Surrogate-Assisted Controller for Expensive Evolutionary Reinforcement Learning	Jan 1, 2022	continuous-controlContinuous Control	—Unverified
A survey of benchmarking frameworks for reinforcement learning	Nov 27, 2020	Benchmarkingreinforcement-learning	—Unverified
A Survey of Constraint Formulations in Safe Reinforcement Learning	Feb 3, 2024	Diversityreinforcement-learning	—Unverified
A Survey of Continual Reinforcement Learning	Jun 27, 2025	Continual LearningDecision Making	—Unverified
A Survey of Deep Reinforcement Learning Algorithms for Motion Planning and Control of Autonomous Vehicles	May 29, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified

Show:10 25 50

← PrevPage 100 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified