Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11201–11225 of 15113 papers

Title	Date	Tasks	Status
Greedy UnMixing for Q-Learning in Multi-Agent Reinforcement Learning	Sep 19, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Green Deep Reinforcement Learning for Radio Resource Management: Architecture, Algorithm Compression and Challenge	Oct 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Griddly: A platform for AI research in games	Nov 12, 2020	Reinforcement Learning (RL)	—Unverified
GriddlyJS: A Web IDE for Reinforcement Learning	Jul 13, 2022	Offline RLreinforcement-learning	—Unverified
Grid-Interactive Multi-Zone Building Control Using Reinforcement Learning with Global-Local Policy Search	Oct 13, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified
GridLearn: Multiagent Reinforcement Learning for Grid-Aware Building Energy Management	Oct 12, 2021	energy managementManagement	—Unverified
GridToPix: Training Embodied Agents with Minimal Supervision	Apr 14, 2021	Deep Reinforcement LearningPointGoal Navigation	—Unverified
GRIMGEP: Learning Progress for Robust Goal Sampling in Visual Deep Reinforcement Learning	Aug 10, 2020	Deep Reinforcement LearningDiversity	—Unverified
GRIm-RePR: Prioritising Generating Important Features for Pseudo-Rehearsal	Nov 27, 2019	Atari GamesContinual Learning	—Unverified
GRIT: Teaching MLLMs to Think with Images	May 21, 2025	Reinforcement Learning (RL)Visual Reasoning	—Unverified
GRL-Prompt: Towards Knowledge Graph based Prompt Optimization via Reinforcement Learning	Nov 19, 2024	General KnowledgePrompt Engineering	—Unverified
Grounded Curriculum Learning	Sep 29, 2024	Reinforcement Learning (RL)	—Unverified
Grounded Reinforcement Learning for Visual Reasoning	May 29, 2025	reinforcement-learningReinforcement Learning	—Unverified
Grounding Aleatoric Uncertainty for Unsupervised Environment Design	Jul 11, 2022	Reinforcement Learning (RL)	—Unverified
Grounding Artificial Intelligence in the Origins of Human Behavior	Dec 15, 2020	Reinforcement Learning (RL)	—Unverified
Grounding Complex Navigational Instructions Using Scene Graphs	Jun 3, 2021	Question Answeringreinforcement-learning	—Unverified
Grounding Hierarchical Reinforcement Learning Models for Knowledge Transfer	Dec 19, 2014	Deep LearningHierarchical Reinforcement Learning	—Unverified
Grounding Language Models in Autonomous Loco-manipulation Tasks	Sep 2, 2024	Language ModelingLanguage Modelling	—Unverified
Grounding Language to Entities for Generalization in Reinforcement Learning	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning	Apr 1, 2025	Reinforcement Learning (RL)Vision-Language-Action	—Unverified
Group Distributionally Robust Reinforcement Learning with Hierarchical Latent Variables	Oct 21, 2022	MuJoCoreinforcement-learning	—Unverified
Grower-in-the-Loop Interactive Reinforcement Learning for Greenhouse Climate Control	May 29, 2025	Reinforcement Learning (RL)	—Unverified
GrowSpace: Learning How to Shape Plants	Oct 15, 2021	FairnessReinforcement Learning (RL)	—Unverified
Grow Your Limits: Continuous Improvement with Real-World RL for Robotic Locomotion	Oct 26, 2023	Deep Reinforcement LearningEfficient Exploration	—Unverified
GRSN: Gated Recurrent Spiking Neurons for POMDPs and MARL	Apr 24, 2024	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 449 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified