Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4726–4750 of 15113 papers

Title	Date	Tasks	Status
A Novel Automated Curriculum Strategy to Solve Hard Sokoban Planning Instances	Oct 3, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Novel Deep Reinforcement Learning Based Stock Direction Prediction using Knowledge Graph and Community Aware Sentiments	Jul 2, 2021	Deep Reinforcement LearningPrediction	—Unverified
A Novel Deep Reinforcement Learning Based Automated Stock Trading System Using Cascaded LSTM Networks	Dec 6, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Novel Deep Reinforcement Learning-based Approach for Enhancing Spectral Efficiency of IRS-assisted Wireless Systems	Jan 24, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Novel Entropy-Maximizing TD3-based Reinforcement Learning for Automatic PID Tuning	Oct 5, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Novel Experts Advice Aggregation Framework Using Deep Reinforcement Learning for Portfolio Management	Dec 29, 2022	Deep Reinforcement LearningManagement	—Unverified
A Novel Framework for Neural Architecture Search in the Hill Climbing Domain	Feb 22, 2021	GPUNeural Architecture Search	—Unverified
A Novel Multi-Agent Deep RL Approach for Traffic Signal Control	Jun 5, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Novel Multi-Objective Reinforcement Learning Algorithm for Pursuit-Evasion Game	Mar 9, 2025	Multi-Objective Reinforcement LearningQ-Learning	—Unverified
A Novel Neuromorphic Processors Realization of Spiking Deep Reinforcement Learning for Portfolio Management	Mar 26, 2022	Deep Reinforcement LearningManagement	—Unverified
A Novel Reinforcement Learning Model for Post-Incident Malware Investigations	Oct 19, 2024	Malware DetectionQ-Learning	—Unverified
A novel repetition normalized adversarial reward for headline generation	Feb 19, 2019	Headline Generationreinforcement-learning	—Unverified
A Novel Stochastic Gradient Descent Algorithm for Learning Principal Subspaces	Dec 8, 2022	Deep Reinforcement LearningImage Compression	—Unverified
An overall view of key problems in algorithmic trading and recent progress	Jun 9, 2020	Algorithmic TradingBIG-bench Machine Learning	—Unverified
An Overview of Machine Learning-Enabled Optimization for Reconfigurable Intelligent Surfaces-Aided 6G Networks: From Reinforcement Learning to Large Language Models	May 9, 2024	Hierarchical Reinforcement LearningManagement	—Unverified
An Overview of Natural Language State Representation for Reinforcement Learning	Jul 19, 2020	reinforcement-learningReinforcement Learning	—Unverified
An RL-Based Adaptive Detection Strategy to Secure Cyber-Physical Systems	Mar 4, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
ANS: Adaptive Network Scaling for Deep Rectifier Reinforcement Learning Models	Sep 6, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Answer-driven Deep Question Generation based on Reinforcement Learning	Dec 1, 2020	DecoderQuestion Generation	—Unverified
Answer Set Programming for Non-Stationary Markov Decision Processes	May 3, 2017	Decision Makingreinforcement-learning	—Unverified
Answer-Supervised Question Reformulation for Enhancing Conversational Machine Comprehension	Nov 1, 2019	Reading Comprehensionreinforcement-learning	—Unverified
Emotional Contagion-Aware Deep Reinforcement Learning for Antagonistic Crowd Simulation	Apr 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Anti-Concentrated Confidence Bonuses for Scalable Exploration	Oct 21, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Antifragile Perimeter Control: Anticipating and Gaining from Disruptions with Reinforcement Learning	Feb 20, 2024	Deep Reinforcement LearningModel Predictive Control	—Unverified
Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System	Jul 24, 2022	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 190 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified