Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4701–4750 of 15113 papers

Title	Date	Tasks	Status
An Invitation to Deep Reinforcement Learning	Dec 13, 2023	Code GenerationDeep Reinforcement Learning	—Unverified
An L^2 Analysis of Reinforcement Learning in High Dimensions with Kernel and Neural Network Approximation	Apr 15, 2021	Reinforcement Learning (RL)	—Unverified
An MRP Formulation for Supervised Learning: Generalized Temporal Difference Learning Models	Apr 23, 2024	image-classificationImage Classification	—Unverified
Annotating Motion Primitives for Simplifying Action Search in Reinforcement Learning	Feb 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
An ocular biomechanics environment for reinforcement learning	Aug 12, 2020	Deep Reinforcement LearningPosition	—Unverified
An Offline Adaptation Framework for Constrained Multi-Objective Reinforcement Learning	Sep 16, 2024	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified
An Offline Deep Reinforcement Learning for Maintenance Decision-Making	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
An Offline Reinforcement Learning Algorithm Customized for Multi-Task Fusion in Large-Scale Recommender Systems	Apr 19, 2024	Efficient ExplorationMulti-Task Learning	—Unverified
Anomalous State Sequence Modeling to Enhance Safety in Reinforcement Learning	Jul 29, 2024	Anomaly DetectionBenchmarking	—Unverified
Anomaly Detection Under Controlled Sensing Using Actor-Critic Reinforcement Learning	May 26, 2020	Anomaly DetectionDecision Making	—Unverified
A non-cooperative meta-modeling game for automated third-party calibrating, validating, and falsifying constitutive laws with parallelized adversarial attacks	Apr 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
An online evolving framework for advancing reinforcement-learning based automated vehicle control	Jun 15, 2020	Decision Makingreinforcement-learning	—Unverified
An Online Model-Following Projection Mechanism Using Reinforcement Learning	Feb 5, 2023	reinforcement-learningReinforcement Learning	—Unverified
An Online Prediction Algorithm for Reinforcement Learning with Linear Function Approximation using Cross Entropy Method	Jun 15, 2018	Computational EfficiencyReinforcement Learning	—Unverified
An open source Multi-Agent Deep Reinforcement Learning Routing Simulator for satellite networks	Jul 8, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
An Optics Controlling Environment and Reinforcement Learning Benchmarks	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
An Optimal Control View of Adversarial Machine Learning	Nov 11, 2018	BIG-bench Machine LearningData Poisoning	—Unverified
An Optimal Online Method of Selecting Source Policies for Reinforcement Learning	Sep 24, 2017	Q-Learningreinforcement-learning	—Unverified
An Optimization Framework for Task Sequencing in Curriculum Learning	Jan 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
An Optimization Method-Assisted Ensemble Deep Reinforcement Learning Algorithm to Solve Unit Commitment Problems	Jun 9, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
An Option-Dependent Analysis of Regret Minimization Algorithms in Finite-Horizon Semi-Markov Decision Processes	May 10, 2023	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment	Sep 2, 2021	OpenAI Gymreinforcement-learning	—Unverified
Reinforcement Learning with Wasserstein Distance Regularisation, with Applications to Multipolicy Learning	Feb 12, 2018	reinforcement-learningReinforcement Learning	—Unverified
A novel agent with formal goal-reaching guarantees: an experimental study with a mobile robot	Sep 23, 2024	Reinforcement Learning (RL)	—Unverified
A novel approach for multi-agent cooperative pursuit to capture grouped evaders	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Novel Automated Curriculum Strategy to Solve Hard Sokoban Planning Instances	Oct 3, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Novel Deep Reinforcement Learning Based Stock Direction Prediction using Knowledge Graph and Community Aware Sentiments	Jul 2, 2021	Deep Reinforcement LearningPrediction	—Unverified
A Novel Deep Reinforcement Learning Based Automated Stock Trading System Using Cascaded LSTM Networks	Dec 6, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Novel Deep Reinforcement Learning-based Approach for Enhancing Spectral Efficiency of IRS-assisted Wireless Systems	Jan 24, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Novel Entropy-Maximizing TD3-based Reinforcement Learning for Automatic PID Tuning	Oct 5, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Novel Experts Advice Aggregation Framework Using Deep Reinforcement Learning for Portfolio Management	Dec 29, 2022	Deep Reinforcement LearningManagement	—Unverified
A Novel Framework for Neural Architecture Search in the Hill Climbing Domain	Feb 22, 2021	GPUNeural Architecture Search	—Unverified
A Novel Multi-Agent Deep RL Approach for Traffic Signal Control	Jun 5, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Novel Multi-Objective Reinforcement Learning Algorithm for Pursuit-Evasion Game	Mar 9, 2025	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
A Novel Neuromorphic Processors Realization of Spiking Deep Reinforcement Learning for Portfolio Management	Mar 26, 2022	Deep Reinforcement LearningManagement	—Unverified
A Novel Reinforcement Learning Model for Post-Incident Malware Investigations	Oct 19, 2024	Malware DetectionQ-Learning	—Unverified
A novel repetition normalized adversarial reward for headline generation	Feb 19, 2019	Headline Generationreinforcement-learning	—Unverified
A Novel Stochastic Gradient Descent Algorithm for Learning Principal Subspaces	Dec 8, 2022	Deep Reinforcement LearningImage Compression	—Unverified
An overall view of key problems in algorithmic trading and recent progress	Jun 9, 2020	Algorithmic TradingBIG-bench Machine Learning	—Unverified
An Overview of Machine Learning-Enabled Optimization for Reconfigurable Intelligent Surfaces-Aided 6G Networks: From Reinforcement Learning to Large Language Models	May 9, 2024	Hierarchical Reinforcement LearningManagement	—Unverified
An Overview of Natural Language State Representation for Reinforcement Learning	Jul 19, 2020	reinforcement-learningReinforcement Learning	—Unverified
An RL-Based Adaptive Detection Strategy to Secure Cyber-Physical Systems	Mar 4, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
ANS: Adaptive Network Scaling for Deep Rectifier Reinforcement Learning Models	Sep 6, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Answer-driven Deep Question Generation based on Reinforcement Learning	Dec 1, 2020	DecoderQuestion Generation	—Unverified
Answer Set Programming for Non-Stationary Markov Decision Processes	May 3, 2017	Decision Makingreinforcement-learning	—Unverified
Answer-Supervised Question Reformulation for Enhancing Conversational Machine Comprehension	Nov 1, 2019	Reading Comprehensionreinforcement-learning	—Unverified
Emotional Contagion-Aware Deep Reinforcement Learning for Antagonistic Crowd Simulation	Apr 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Anti-Concentrated Confidence Bonuses for Scalable Exploration	Oct 21, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Antifragile Perimeter Control: Anticipating and Gaining from Disruptions with Reinforcement Learning	Feb 20, 2024	Deep Reinforcement LearningModel Predictive Control	—Unverified
Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System	Jul 24, 2022	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 95 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified