Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11151–11175 of 15113 papers

Title	Date	Tasks	Status
Goal-Space Planning with Subgoal Models	Jun 6, 2022	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
GOATS: Goal Sampling Adaptation for Scooping with Curriculum Reinforcement Learning	Mar 9, 2023	Positionreinforcement-learning	—Unverified
Go-Blend behavior and affect	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
GoChat: Goal-oriented Chatbots with Hierarchical Reinforcement Learning	May 24, 2020	ChatbotHierarchical Reinforcement Learning	—Unverified
Going Beyond Linear RL: Sample Efficient Neural Function Approximation	Jul 14, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Good Actions Succeed, Bad Actions Generalize: A Case Study on Why RL Generalizes Better	Mar 19, 2025	AttributeReinforcement Learning (RL)	—Unverified
Honey, I Shrunk The Actor: A Case Study on Preserving Performance with Smaller Actors in Actor-Critic RL	Feb 23, 2021	Reinforcement Learning (RL)	—Unverified
Good, Better, Best: Textual Distractors Generation for Multiple-Choice Visual Question Answering via Reinforcement Learning	Oct 21, 2019	Data AugmentationDecision Making	—Unverified
Government Intervention in Catastrophe Insurance Markets: A Reinforcement Learning Approach	Jul 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
GraCo -- A Graph Composer for Integrated Circuits	Nov 21, 2024	Reinforcement Learning (RL)	—Unverified
Gradient-EM Bayesian Meta-learning	Jun 21, 2020	Computational EfficiencyFew-Shot Image Classification	—Unverified
Gradient-Free Neural Network Training via Synaptic-Level Reinforcement Learning	May 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Gradient Imitation Reinforcement Learning for General Low-Resource Information Extraction	Nov 11, 2022	Event Extractionnamed-entity-recognition	—Unverified
Gradient Monitored Reinforcement Learning	May 25, 2020	Atari Gamescontinuous-control	—Unverified
Gradient Q(σ, λ): A Unified Algorithm with Function Approximation for Reinforcement Learning	Sep 6, 2019	Q-LearningReinforcement Learning	—Unverified
Gradient Shaping for Multi-Constraint Safe Reinforcement Learning	Dec 23, 2023	reinforcement-learningReinforcement Learning	—Unverified
GraMeR: Graph Meta Reinforcement Learning for Multi-Objective Influence Maximization	May 30, 2022	Computational EfficiencyMarketing	—Unverified
Grammar and Gameplay-aligned RL for Game Description Generation with LLMs	Mar 20, 2025	reinforcement-learningReinforcement Learning	—Unverified
Grammatical Error Correction with Neural Reinforcement Learning	Jul 2, 2017	DecoderGrammatical Error Correction	—Unverified
Granger Causal Interaction Skill Chains	Jun 15, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Graph-attention-based Casual Discovery with Trust Region-navigated Clipping Policy Optimization	Dec 27, 2024	Causal DiscoveryGraph Attention	—Unverified
Graph augmented Deep Reinforcement Learning in the GameRLand3D environment	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Graph-based Heuristic Search for Module Selection Procedure in Neural Module Network	Sep 30, 2020	Heuristic SearchQuestion Answering	—Unverified
Graph-based Reinforcement Learning meets Mixed Integer Programs: An application to 3D robot assembly discovery	Mar 8, 2022	global-optimizationMotion Planning	—Unverified
GraphBit: Bitwise Interaction Mining via Deep Reinforcement Learning	Jun 1, 2018	BinarizationDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 447 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified