Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9926–9950 of 15113 papers

Title	Date	Tasks	Status
Multi-Agent Deep Reinforcement Learning in Vehicular OCC	May 5, 2022	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Multi-agent deep reinforcement learning (MADRL) meets multi-user MIMO systems	Sep 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Multi-Agent Deep Reinforcement Learning using Attentive Graph Neural Architectures for Real-Time Strategy Games	May 21, 2021	Deep Reinforcement LearningGraph Attention	—Unverified
Multi-agent Deep Reinforcement Learning with Extremely Noisy Observations	Dec 3, 2018	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Multi-Agent Deep Reinforcement Learning with Human Strategies	Jun 12, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Multi-Agent Deep Reinforcement Learning with Adaptive Policies	Nov 28, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Multi-agent Embodied AI: Advances and Future Directions	May 8, 2025	NavigateReinforcement Learning (RL)	—Unverified
Multi-agent Hierarchical Reinforcement Learning with Dynamic Termination	Oct 21, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Multi-Agent Hierarchical Reinforcement Learning for Humanoid Navigation	Sep 25, 2019	Collision AvoidanceHierarchical Reinforcement Learning	—Unverified
Multi-Agent Informational Learning Processes	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Multi-agent Inverse Reinforcement Learning for Two-person Zero-sum Games	Mar 25, 2014	reinforcement-learningReinforcement Learning	—Unverified
Multi-agent Inverse Reinforcement Learning for Certain General-sum Stochastic Games	Jun 26, 2018	reinforcement-learningReinforcement Learning	—Unverified
Multi-Agent Inverse Reinforcement Learning: Suboptimal Demonstrations and Alternative Solution Concepts	Sep 2, 2021	Decision MakingDescriptive	—Unverified
Multi-Agent Learning of Numerical Methods for Hyperbolic PDEs with Factored Dec-MDP	May 31, 2022	Decision Makingreinforcement-learning	—Unverified
Multi-Agent Manipulation via Locomotion using Hierarchical Sim2Real	Aug 13, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable Edge Computing Systems	Feb 20, 2020	Edge-computingMeta Reinforcement Learning	—Unverified
Multi-agent Motion Planning for Dense and Dynamic Environments via Deep Reinforcement Learning	Jan 18, 2020	Deep Reinforcement LearningMotion Planning	—Unverified
Multi-agent Natural Actor-critic Reinforcement Learning Algorithms	Sep 3, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Multi-agent navigation based on deep reinforcement learning and traditional pathfinding algorithm	Dec 5, 2020	Collision AvoidanceDeep Reinforcement Learning	—Unverified
Multi-agent Off-policy Actor-Critic Reinforcement Learning for Partially Observable Environments	Jul 6, 2024	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Multi-agent Path Finding for Timed Tasks using Evolutionary Games	Nov 15, 2024	Multi-Agent Path FindingReinforcement Learning (RL)	—Unverified
Multi-Agent Path Planning Using Deep Reinforcement Learning	Oct 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
An Energy-aware and Fault-tolerant Deep Reinforcement Learning based approach for Multi-agent Patrolling Problems	Dec 16, 2022	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Multi-agent Policy Reciprocity with Theoretical Guarantee	Apr 12, 2023	continuous-controlContinuous Control	—Unverified
Multi-Agent Probabilistic Ensembles with Trajectory Sampling for Connected Autonomous Vehicles	Dec 21, 2023	Autonomous VehiclesDecision Making	—Unverified

Show:10 25 50

← PrevPage 398 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified