Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11176–11200 of 15113 papers

Title	Date	Tasks	Status
Graph Convolutional Policy for Solving Tree Decomposition via Reinforcement Learning Heuristics	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Graph Convolutional Reinforcement Learning for Collaborative Queuing Agents	May 24, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified
Graph-enabled Reinforcement Learning for Time Series Forecasting with Adaptive Intelligence	Sep 18, 2023	Bayesian OptimisationDeep Learning	—Unverified
Graph-Enhanced Exploration for Goal-oriented Reinforcement Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Graph neural induction of value iteration	Sep 26, 2020	Deep Reinforcement LearningGraph Neural Network	—Unverified
Graph Neural Network based Agent in Google Research Football	Apr 23, 2022	Graph Neural NetworkQ-Learning	—Unverified
Graph Neural Networks for Image Classification and Reinforcement Learning using Graph representations	Mar 7, 2022	image-classificationImage Classification	—Unverified
Graph Neural Networks for Relational Inductive Bias in Vision-based Deep Reinforcement Learning of Robot Control	Mar 11, 2022	Deep Reinforcement LearningGraph Neural Network	—Unverified
Graph Pruning for Model Compression	Nov 22, 2019	AutoMLmodel	—Unverified
Graph Reinforcement Learning-based CNN Inference Offloading in Dynamic Edge Computing	Oct 24, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Graph Reinforcement Learning for Operator Selection in the ALNS Metaheuristic	Feb 28, 2023	Deep Reinforcement LearningOpen-Ended Question Answering	—Unverified
Designing Heterogeneous GNNs with Desired Permutation Properties for Wireless Resource Allocation	Mar 8, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Large-Scale Graph Reinforcement Learning in Wireless Control Systems	Jan 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Graph Signal Sampling via Reinforcement Learning	May 15, 2018	reinforcement-learningReinforcement Learning	—Unverified
GraphSR: A Data Augmentation Algorithm for Imbalanced Node Classification	Feb 24, 2023	ClassificationData Augmentation	—Unverified
Graph Value Iteration	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
GraspARL: Dynamic Grasping via Adversarial Reinforcement Learning	Mar 4, 2022	Objectreinforcement-learning	—Unverified
GrASP: Gradient-Based Affordance Selection for Planning	Feb 8, 2022	Reinforcement Learning (RL)	—Unverified
Graying the black box: Understanding DQNs	Feb 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Greedy Bandits with Sampled Context	Jul 27, 2020	Decision MakingMulti-Armed Bandits	—Unverified
Greedy-based Value Representation for Efficient Coordination in Multi-agent Reinforcement Learning	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Greedy based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning	Nov 22, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Greedy-GQ with Variance Reduction: Finite-time Analysis and Improved Complexity	Mar 30, 2021	Reinforcement Learning (RL)	—Unverified
Greedy-Step Off-Policy Reinforcement Learning	Feb 23, 2021	Q-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 448 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified