Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7701–7725 of 15113 papers

Title	Date	Tasks	Status
Graph Pruning for Model Compression	Nov 22, 2019	AutoMLmodel	—Unverified
Graph Reinforcement Learning-based CNN Inference Offloading in Dynamic Edge Computing	Oct 24, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Graph Reinforcement Learning for Operator Selection in the ALNS Metaheuristic	Feb 28, 2023	Deep Reinforcement LearningOpen-Ended Question Answering	—Unverified
Designing Heterogeneous GNNs with Desired Permutation Properties for Wireless Resource Allocation	Mar 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Large-Scale Graph Reinforcement Learning in Wireless Control Systems	Jan 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Graph Signal Sampling via Reinforcement Learning	May 15, 2018	reinforcement-learningReinforcement Learning	—Unverified
GraphSR: A Data Augmentation Algorithm for Imbalanced Node Classification	Feb 24, 2023	ClassificationData Augmentation	—Unverified
Graph Value Iteration	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
GraspARL: Dynamic Grasping via Adversarial Reinforcement Learning	Mar 4, 2022	Objectreinforcement-learning	—Unverified
GrASP: Gradient-Based Affordance Selection for Planning	Feb 8, 2022	Reinforcement Learning (RL)	—Unverified
Graying the black box: Understanding DQNs	Feb 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Greedy Bandits with Sampled Context	Jul 27, 2020	Decision MakingMulti-Armed Bandits	—Unverified
Greedy-based Value Representation for Efficient Coordination in Multi-agent Reinforcement Learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Greedy based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning	Nov 22, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Greedy-GQ with Variance Reduction: Finite-time Analysis and Improved Complexity	Mar 30, 2021	Reinforcement Learning (RL)	—Unverified
Greedy-Step Off-Policy Reinforcement Learning	Feb 23, 2021	Q-Learningreinforcement-learning	—Unverified
Greedy UnMixing for Q-Learning in Multi-Agent Reinforcement Learning	Sep 19, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Green Deep Reinforcement Learning for Radio Resource Management: Architecture, Algorithm Compression and Challenge	Oct 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Griddly: A platform for AI research in games	Nov 12, 2020	Reinforcement Learning (RL)	—Unverified
GriddlyJS: A Web IDE for Reinforcement Learning	Jul 13, 2022	Offline RLreinforcement-learning	—Unverified
Grid-Interactive Multi-Zone Building Control Using Reinforcement Learning with Global-Local Policy Search	Oct 13, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified
GridLearn: Multiagent Reinforcement Learning for Grid-Aware Building Energy Management	Oct 12, 2021	energy managementManagement	—Unverified
GridToPix: Training Embodied Agents with Minimal Supervision	Apr 14, 2021	Deep Reinforcement LearningPointGoal Navigation	—Unverified
GRIMGEP: Learning Progress for Robust Goal Sampling in Visual Deep Reinforcement Learning	Aug 10, 2020	Deep Reinforcement LearningDiversity	—Unverified
GRIm-RePR: Prioritising Generating Important Features for Pseudo-Rehearsal	Nov 27, 2019	Atari GamesContinual Learning	—Unverified

Show:10 25 50

← PrevPage 309 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified