Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7700 of 15113 papers

Title	Date	Tasks	Status
Global Convergence of the ODE Limit for Online Actor-Critic Algorithms in Reinforcement Learning	Aug 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Global Reinforcement Learning: Beyond Linear and Convex Rewards via Submodular Semi-gradient Methods	Jul 13, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
Goal-conditioned Batch Reinforcement Learning for Rotation Invariant Locomotion	Apr 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Goal-Conditioned Data Augmentation for Offline Reinforcement Learning	Dec 29, 2024	D4RLData Augmentation	—Unverified
Goal-conditioned Imitation Learning	May 16, 2019	Imitation LearningReinforcement Learning (RL)	—Unverified
Goal-conditioned Offline Reinforcement Learning through State Space Partitioning	Mar 16, 2023	Inductive Biasreinforcement-learning	—Unverified
Goal-Conditioned Reinforcement Learning in the Presence of an Adversary	Nov 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Goal-Conditioned Reinforcement Learning with Imagined Subgoals	Jul 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Goal-directed Generation of Discrete Structures with Conditional Generative Models	Oct 5, 2020	Heuristic SearchProgram Synthesis	—Unverified
Goal-Directed Planning by Reinforcement Learning and Active Inference	Jun 18, 2021	Bayesian InferenceDecision Making	—Unverified
Goal-Directed Story Generation: Augmenting Generative Language Models with Reinforcement Learning	Dec 16, 2021	Deep Reinforcement LearningGraph Attention	—Unverified
Goal-Driven Sequential Data Abstraction	Jul 29, 2019	BenchmarkingGeneral Reinforcement Learning	—Unverified
Goal-oriented Dialogue Policy Learning from Failures	Aug 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Goal-Oriented Next Best Activity Recommendation using Reinforcement Learning	May 6, 2022	Activity Predictionreinforcement-learning	—Unverified
Goal-oriented Trajectories for Efficient Exploration	Jul 5, 2018	Efficient Explorationreinforcement-learning	—Unverified
Goal-Oriented Visual Question Generation via Intermediate Rewards	Sep 1, 2018	Deep Reinforcement LearningInformativeness	—Unverified
Goal-Space Planning with Subgoal Models	Jun 6, 2022	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
GOATS: Goal Sampling Adaptation for Scooping with Curriculum Reinforcement Learning	Mar 9, 2023	Positionreinforcement-learning	—Unverified
Go-Blend behavior and affect	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
GoChat: Goal-oriented Chatbots with Hierarchical Reinforcement Learning	May 24, 2020	ChatbotHierarchical Reinforcement Learning	—Unverified
Going Beyond Linear RL: Sample Efficient Neural Function Approximation	Jul 14, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Good Actions Succeed, Bad Actions Generalize: A Case Study on Why RL Generalizes Better	Mar 19, 2025	AttributeReinforcement Learning (RL)	—Unverified
Honey, I Shrunk The Actor: A Case Study on Preserving Performance with Smaller Actors in Actor-Critic RL	Feb 23, 2021	Reinforcement Learning (RL)	—Unverified
Good, Better, Best: Textual Distractors Generation for Multiple-Choice Visual Question Answering via Reinforcement Learning	Oct 21, 2019	Data AugmentationDecision Making	—Unverified
Government Intervention in Catastrophe Insurance Markets: A Reinforcement Learning Approach	Jul 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
GraCo -- A Graph Composer for Integrated Circuits	Nov 21, 2024	Reinforcement Learning (RL)	—Unverified
Gradient-EM Bayesian Meta-learning	Jun 21, 2020	Computational EfficiencyFew-Shot Image Classification	—Unverified
Gradient-Free Neural Network Training via Synaptic-Level Reinforcement Learning	May 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Gradient Imitation Reinforcement Learning for General Low-Resource Information Extraction	Nov 11, 2022	Event Extractionnamed-entity-recognition	—Unverified
Gradient Monitored Reinforcement Learning	May 25, 2020	Atari Gamescontinuous-control	—Unverified
Gradient Q(σ, λ): A Unified Algorithm with Function Approximation for Reinforcement Learning	Sep 6, 2019	Q-LearningReinforcement Learning	—Unverified
Gradient Shaping for Multi-Constraint Safe Reinforcement Learning	Dec 23, 2023	reinforcement-learningReinforcement Learning	—Unverified
GraMeR: Graph Meta Reinforcement Learning for Multi-Objective Influence Maximization	May 30, 2022	Computational EfficiencyMarketing	—Unverified
Grammar and Gameplay-aligned RL for Game Description Generation with LLMs	Mar 20, 2025	reinforcement-learningReinforcement Learning	—Unverified
Grammatical Error Correction with Neural Reinforcement Learning	Jul 2, 2017	DecoderGrammatical Error Correction	—Unverified
Granger Causal Interaction Skill Chains	Jun 15, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Graph-attention-based Casual Discovery with Trust Region-navigated Clipping Policy Optimization	Dec 27, 2024	Causal DiscoveryGraph Attention	—Unverified
Graph augmented Deep Reinforcement Learning in the GameRLand3D environment	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Graph-based Heuristic Search for Module Selection Procedure in Neural Module Network	Sep 30, 2020	Heuristic SearchQuestion Answering	—Unverified
Graph-based Reinforcement Learning meets Mixed Integer Programs: An application to 3D robot assembly discovery	Mar 8, 2022	global-optimizationMotion Planning	—Unverified
GraphBit: Bitwise Interaction Mining via Deep Reinforcement Learning	Jun 1, 2018	BinarizationDeep Reinforcement Learning	—Unverified
Graph Convolutional Policy for Solving Tree Decomposition via Reinforcement Learning Heuristics	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Graph Convolutional Reinforcement Learning for Collaborative Queuing Agents	May 24, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified
Graph-enabled Reinforcement Learning for Time Series Forecasting with Adaptive Intelligence	Sep 18, 2023	Bayesian OptimisationDeep Learning	—Unverified
Graph-Enhanced Exploration for Goal-oriented Reinforcement Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Graph neural induction of value iteration	Sep 26, 2020	Deep Reinforcement LearningGraph Neural Network	—Unverified
Graph Neural Network based Agent in Google Research Football	Apr 23, 2022	Graph Neural NetworkQ-Learning	—Unverified
Graph Neural Networks for Image Classification and Reinforcement Learning using Graph representations	Mar 7, 2022	image-classificationImage Classification	—Unverified
Graph Neural Networks for Relational Inductive Bias in Vision-based Deep Reinforcement Learning of Robot Control	Mar 11, 2022	Deep Reinforcement LearningGraph Neural Network	—Unverified

Show:10 25 50

← PrevPage 154 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified