Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2901–2950 of 15113 papers

Title	Date	Tasks	Status
Attention-based Reinforcement Learning for Real-Time UAV Semantic Communication	May 22, 2021	Deep Reinforcement LearningGraph Attention	—Unverified
Attention-based QoE-aware Digital Twin Empowered Edge Computing for Immersive Virtual Reality	May 15, 2023	Continual LearningEdge-computing	—Unverified
AI-driven materials design: a mini-review	Feb 5, 2025	Evolutionary AlgorithmsReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Adaptive Caching in Hierarchical Content Delivery Networks	Feb 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Attention-based Fault-tolerant Approach for Multi-agent Reinforcement Learning Systems	Oct 5, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
AAMDRL: Augmented Asset Management with Deep Reinforcement Learning	Sep 30, 2020	Asset ManagementDeep Reinforcement Learning	—Unverified
Attention-based Deep Reinforcement Learning for Multi-view Environments	May 10, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
AI-based traffic analysis in digital twin networks	Nov 1, 2024	FairnessFederated Learning	—Unverified
Adaptive Behavior Generation for Autonomous Driving using Deep Reinforcement Learning with Compact Semantic States	Sep 10, 2018	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Decision-making Strategy on Highway for Autonomous Vehicles using Deep Reinforcement Learning	Jul 16, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified
Decision Mamba: Reinforcement Learning via Hybrid Selective Sequence Modeling	May 31, 2024	D4RLMamba	—Unverified
Decoding Polar Codes with Reinforcement Learning	Sep 15, 2020	Decoderreinforcement-learning	—Unverified
Deep Distributional Learning with Non-crossing Quantile Network	Apr 11, 2025	Distributional Reinforcement Learningquantile regression	—Unverified
Attention-Aware Face Hallucination via Deep Reinforcement Learning	Aug 10, 2017	Deep Reinforcement LearningFace Hallucination	—Unverified
Attention-Aware Deep Reinforcement Learning for Video Face Recognition	Oct 1, 2017	Deep Reinforcement LearningFace Recognition	—Unverified
AI-based Robust Resource Allocation in End-to-End Network Slicing under Demand and CSI Uncertainties	Feb 10, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Attentional Policies for Cross-Context Multi-Agent Reinforcement Learning	May 31, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
AI-based Resource Allocation: Reinforcement Learning for Adaptive Auto-scaling in Serverless Environments	May 29, 2020	Cloud ComputingManagement	—Unverified
AttendLight: Universal Attention-Based Reinforcement Learning Model for Traffic Signal Control	Oct 12, 2020	Decision Makingreinforcement-learning	—Unverified
Attend2Pack: Bin Packing through Deep Reinforcement Learning with Attention	Jul 9, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
AI-based Radio Resource Management and Trajectory Design for PD-NOMA Communication in IRS-UAV Assisted Networks	Nov 6, 2021	ManagementReinforcement Learning (RL)	—Unverified
Attacking Deep Reinforcement Learning-Based Traffic Signal Control Systems with Colluding Vehicles	Nov 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
AI Assisted Annotator using Reinforcement Learning	Oct 2, 2019	Decision Makingreinforcement-learning	—Unverified
Adaptive Batch Size for Safe Policy Gradients	Dec 1, 2017	Policy Gradient MethodsReinforcement Learning	—Unverified
Attacking and Defending Deep Reinforcement Learning Policies	May 16, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
AI-as-a-Service Toolkit for Human-Centered Intelligence in Autonomous Driving	Feb 3, 2022	Autonomous Drivingreinforcement-learning	—Unverified
AttackGNN: Red-Teaming GNNs in Hardware Security Using Reinforcement Learning	Feb 21, 2024	Graph Neural NetworkRed Teaming	—Unverified
A* Tree Search for Portfolio Management	Jan 7, 2019	Deep Reinforcement LearningManagement	—Unverified
ACECODER: Acing Coder RL via Automated Test-Case Synthesis	Feb 3, 2025	HumanEvalmbpp	—Unverified
A Hysteretic Q-learning Coordination Framework for Emerging Mobility Systems in Smart Cities	Nov 5, 2020	Q-Learningreinforcement-learning	—Unverified
A Transferable Approach for Partitioning Machine Learning Models on Multi-Chip-Modules	Dec 7, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Constrained Reinforcement Learning Has Zero Duality Gap	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Transferable and Automatic Tuning of Deep Reinforcement Learning for Cost Effective Phishing Detection	Sep 19, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Adaptive and Multiple Time-scale Eligibility Traces for Online Deep Reinforcement Learning	Aug 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deciding What's Fair: Challenges of Applying Reinforcement Learning in Online Marketplaces	Oct 12, 2021	Fairnessreinforcement-learning	—Unverified
Deciding What to Model: Value-Equivalent Sampling for Reinforcement Learning	Jun 4, 2022	Decision MakingModel-based Reinforcement Learning	—Unverified
Decision ConvFormer: Local Filtering in MetaFormer is Sufficient for Decision Making	Oct 4, 2023	Decision MakingReinforcement Learning (RL)	—Unverified
ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories	Jun 6, 2024	Data Augmentationreinforcement-learning	—Unverified
A Tractable Algorithm For Finite-Horizon Continuous Reinforcement Learning	Jun 26, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Hybrid PAC Reinforcement Learning Algorithm	Sep 5, 2020	Q-Learningreinforcement-learning	—Unverified
A Hybrid Neuro-Symbolic approach for Text-Based Games using Inductive Logic Programming	Nov 21, 2021	Inductive logic programmingNatural Language Understanding	—Unverified
Adaptive Aggregation for Safety-Critical Control	Feb 7, 2023	reinforcement-learningReinforcement Learning	—Unverified
Deceptive Reinforcement Learning for Privacy-Preserving Planning	Feb 5, 2021	Privacy Preservingreinforcement-learning	—Unverified
INTAGS: Interactive Agent-Guided Simulation	Sep 4, 2023	Algorithmic TradingCausal Inference	—Unverified
At Human Speed: Deep Reinforcement Learning with Action Delay	Oct 16, 2018	Board GamesDeep Reinforcement Learning	—Unverified
Adaptive Adversarial Training for Meta Reinforcement Learning	Apr 27, 2021	Generative Adversarial NetworkMeta-Learning	—Unverified
A Hybrid Approach for Reinforcement Learning Using Virtual Policy Gradient for Balancing an Inverted Pendulum	Feb 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Fast Convergence Theory for Offline Decision Making	Jun 3, 2024	Decision MakingOffline RL	—Unverified
ACE: An Actor Ensemble Algorithm for Continuous Control with Tree Search	Nov 6, 2018	continuous-controlContinuous Control	—Unverified
AACC: Asymmetric Actor-Critic in Contextual Reinforcement Learning	Aug 3, 2022	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 59 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified