Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7650 of 15113 papers

Title	Date	Tasks	Status
Generating Interpretable Fuzzy Controllers using Particle Swarm Optimization and Genetic Programming	Apr 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
Generating Paraphrases with Lean Vocabulary	Oct 1, 2019	Paraphrase Generationreinforcement-learning	—Unverified
Improving Factual Consistency Between a Response and Persona Facts	Apr 30, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Generating Rescheduling Knowledge using Reinforcement Learning in a Cognitive Architecture	May 12, 2018	reinforcement-learningReinforcement Learning	—Unverified
Generating Socially Acceptable Perturbations for Efficient Evaluation of Autonomous Vehicles	Mar 18, 2020	Autonomous VehiclesDecision Making	—Unverified
Generating stable molecules using imitation and reinforcement learning	Jul 11, 2021	Imitation Learningreinforcement-learning	—Unverified
Generating Student Feedback from Time-Series Data Using Reinforcement Learning	Aug 1, 2013	Data-to-Text Generationreinforcement-learning	—Unverified
Generating Text with Deep Reinforcement Learning	Oct 30, 2015	DecoderDeep Reinforcement Learning	—Unverified
Generation of Policy-Level Explanations for Reinforcement Learning	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Generative Adversarial Exploration for Reinforcement Learning	Jan 27, 2022	Generative Adversarial NetworkMontezuma's Revenge	—Unverified
Generative Adversarial Imagination for Sample Efficient Deep Reinforcement Learning	Apr 30, 2019	Deep Reinforcement LearningGame of Go	—Unverified
Generative Adversarial Imitation Learning with Neural Networks: Global Optimality and Convergence Rate	Mar 8, 2020	Imitation Learningreinforcement-learning	—Unverified
Generative Adversarial Imitation Learning with Neural Network Parameterization: Global Optimality and Convergence Rate	Jan 1, 2020	Imitation Learningreinforcement-learning	—Unverified
Generative Adversarial Imitation Learning for End-to-End Autonomous Driving on Urban Environments	Oct 16, 2021	Autonomous DrivingAutonomous Navigation	—Unverified
Generative Adversarial Reward Learning for Generalized Behavior Tendency Inference	May 3, 2021	Recommendation Systemsreinforcement-learning	—Unverified
Generative Adversarial Self-Imitation Learning	Dec 3, 2018	Imitation LearningMuJoCo	—Unverified
Generative Adversarial Simulator	Nov 23, 2020	Data-free Knowledge DistillationKnowledge Distillation	—Unverified
Generative Design by Reinforcement Learning: Enhancing the Diversity of Topology Optimization Designs	Aug 17, 2020	CPUDiversity	—Unverified
Generative Exploration and Exploitation	Apr 21, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Generative Inverse Deep Reinforcement Learning for Online Recommendation	Nov 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Generative Job Recommendations with Large Language Model	Jul 5, 2023	Collaborative FilteringLanguage Modeling	—Unverified
Generative Memory for Lifelong Reinforcement Learning	Feb 22, 2019	Lifelong learningreinforcement-learning	—Unverified
Generative methods for sampling transition paths in molecular dynamics	May 5, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Generative Multi-Agent Q-Learning for Policy Optimization: Decentralized Wireless Networks	Mar 7, 2025	Q-LearningReinforcement Learning (RL)	—Unverified
Generative Slate Recommendation with Reinforcement Learning	Jan 20, 2023	Recommendation Systemsreinforcement-learning	—Unverified
Generator and Critic: A Deep Reinforcement Learning Approach for Slate Re-ranking in E-commerce	May 25, 2020	Deep Reinforcement LearningDiversity	—Unverified
Genetic Algorithm enhanced by Deep Reinforcement Learning in parent selection mechanism and mutation : Minimizing makespan in permutation flow shop scheduling problems	Nov 10, 2023	Deep Reinforcement LearningDiversity	—Unverified
Genetic Drift Regularization: on preventing Actor Injection from breaking Evolution Strategies	May 7, 2024	Evolutionary AlgorithmsReinforcement Learning (RL)	—Unverified
Genetic-Gated Networks for Deep Reinforcement	Nov 26, 2018	reinforcement-learningReinforcement Learning	—Unverified
Genetic-Gated Networks for Deep Reinforcement Learning	Dec 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Genetic Programming with Reinforcement Learning Trained Transformer for Real-World Dynamic Scheduling Problems	Apr 10, 2025	Reinforcement Learning (RL)Scheduling	—Unverified
Genetic Soft Updates for Policy Evolution in Deep Reinforcement Learning	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
GenPO: Generative Diffusion Models Meet On-Policy Reinforcement Learning	May 24, 2025	GPUOffline RL	—Unverified
GenTUS: Simulating User Behaviour and Language in Task-oriented Dialogues with Generative Transformers	Aug 23, 2022	DecoderLanguage Modelling	—Unverified
Geometric Active Exploration in Markov Decision Processes: the Benefit of Abstraction	Jul 18, 2024	Computational EfficiencyReinforcement Learning (RL)	—Unverified
Geometrically Coupled Monte Carlo Sampling	Dec 1, 2018	BIG-bench Machine Learningreinforcement-learning	—Unverified
Geometric Entropic Exploration	Jan 6, 2021	Reinforcement Learning (RL)	—Unverified
Geometric Multi-Model Fitting by Deep Reinforcement Learning	Sep 22, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Geometric Value Iteration: Dynamic Error-Aware KL Regularization for Reinforcement Learning	Jul 16, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Getting By Goal Misgeneralization With a Little Help From a Mentor	Oct 28, 2024	Reinforcement Learning (RL)	—Unverified
GFlowNet Fine-tuning for Diverse Correct Solutions in Mathematical Reasoning Tasks	Oct 26, 2024	DiversityMathematical Reasoning	—Unverified
GFlowVLM: Enhancing Multi-step Reasoning in Vision-Language Models with Generative Flow Networks	Mar 9, 2025	Card GamesDiversity	—Unverified
GitFL: Adaptive Asynchronous Federated Learning using Version Control	Nov 22, 2022	Federated LearningReinforcement Learning (RL)	—Unverified
GitGraph - Architecture Search Space Creation through Frequent Computational Subgraph Mining	Jan 16, 2018	Evolutionary AlgorithmsNeural Architecture Search	—Unverified
GITSR: Graph Interaction Transformer-based Scene Representation for Multi Vehicle Collaborative Decision-making	Nov 3, 2024	Decision MakingGraph Neural Network	—Unverified
A Simulation Environment and Reinforcement Learning Method for Waste Reduction	May 30, 2022	Distributional Reinforcement Learningreinforcement-learning	—Unverified
G-Learner and GIRL: Goal Based Wealth Management with Reinforcement Learning	Feb 25, 2020	ManagementQ-Learning	—Unverified
GLiDE: Generalizable Quadrupedal Locomotion in Diverse Environments with a Centroidal Model	Apr 20, 2021	Model Predictive ControlReinforcement Learning (RL)	—Unverified
GLIDE-RL: Grounded Language Instruction through DEmonstration in RL	Jan 3, 2024	Continual Learningreinforcement-learning	—Unverified
Global Convergence of Localized Policy Iteration in Networked Multi-Agent Reinforcement Learning	Nov 30, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 153 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified