Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14501–14550 of 15113 papers

Title	Date	Tasks	Status
Learning-based Model Predictive Control for Safe Exploration and Reinforcement Learning	Jun 27, 2019	Model Predictive Controlreinforcement-learning	CodeCode Available
Efficient Information Diffusion in Time-Varying Graphs through Deep Reinforcement Learning	Nov 27, 2020	Deep Reinforcement LearningGraph Embedding	CodeCode Available
Efficient Collaborative Multi-Agent Deep Reinforcement Learning for Large-Scale Fleet Management	Feb 18, 2018	Deep Reinforcement LearningManagement	CodeCode Available
Learning Where to Sample in Structured Prediction	May 9, 2015	PredictionReinforcement Learning (RL)	CodeCode Available
Carle's Game: An Open-Ended Challenge in Exploratory Machine Creativity	Jul 13, 2021	Artificial LifeGPU	CodeCode Available
Generalization in Reinforcement Learning with Selective Noise Injection and Information Bottleneck	Oct 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Generalization in Text-based Games via Hierarchical Reinforcement Learning	Sep 21, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available
Dealing with uncertainty: balancing exploration and exploitation in deep recurrent reinforcement learning	Oct 12, 2023	Autonomous Drivingreinforcement-learning	CodeCode Available
Generalization in Visual Reinforcement Learning with the Reward Sequence Distribution	Feb 19, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
A Biologically Plausible Learning Rule for Deep Learning in the Brain	Nov 5, 2018	Deep Learningimage-classification	CodeCode Available
Decentralized Transformers with Centralized Aggregation are Sample-Efficient Multi-Agent World Models	Jun 22, 2024	Reinforcement Learning (RL)SMAC	CodeCode Available
A Structured Prediction Approach for Generalization in Cooperative Multi-Agent Reinforcement Learning	Oct 19, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Impartial Games: A Challenge for Reinforcement Learning	May 25, 2022	Board GamesPosition	CodeCode Available
Efficient Model-Based Deep Reinforcement Learning with Variational State Tabulation	Feb 12, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Generalization through Simulation: Integrating Simulated and Real Data into Deep Reinforcement Learning for Vision-Based Autonomous Flight	Feb 11, 2019	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available
Learning to Optimize Variational Quantum Circuits to Solve Combinatorial Problems	Nov 25, 2019	Combinatorial OptimizationDensity Estimation	CodeCode Available
Can maker-taker fees prevent algorithmic cooperation in market making?	Nov 1, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Decentralized Computation Offloading for Multi-User Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 16, 2018	Deep Reinforcement LearningEdge-computing	CodeCode Available
Generalization Tower Network: A Novel Deep Neural Network Architecture for Multi-Task Learning	Oct 27, 2017	Atari GamesMulti-Task Learning	CodeCode Available
Efficient Model-free Reinforcement Learning in Metric Spaces	May 1, 2019	Q-Learningreinforcement-learning	CodeCode Available
Can Deep Reinforcement Learning Solve Erdos-Selfridge-Spencer Games?	Nov 7, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Imperfect also Deserves Reward: Multi-Level and Sequential Reward Modeling for Better Dialog Management	Apr 10, 2021	Managementreinforcement-learning	CodeCode Available
Generalized Adaptive Transfer Network: Enhancing Transfer Learning in Reinforcement Learning Across Domains	Jul 2, 2025	Atari GamesChatbot	CodeCode Available
Can ChatGPT Enable ITS? The Case of Mixed Traffic Control via Reinforcement Learning	Jun 13, 2023	General KnowledgeManagement	CodeCode Available
Efficient Object Detection in Large Images using Deep Reinforcement Learning	Dec 9, 2019	Deep Reinforcement Learningobject-detection	CodeCode Available
Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables	Mar 19, 2019	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
A State-Distribution Matching Approach to Non-Episodic Reinforcement Learning	May 11, 2022	continuous-controlContinuous Control	CodeCode Available
Decaying Clipping Range in Proximal Policy Optimization	Feb 20, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
DEAR: Disentangled Environment and Agent Representations for Reinforcement Learning without Reconstruction	Jun 30, 2024	Reinforcement Learning (RL)	CodeCode Available
Can Agents Run Relay Race with Strangers? Generalization of RL to Out-of-Distribution Trajectories	Apr 26, 2023	Reinforcement Learning (RL)	CodeCode Available
Assistive Teaching of Motor Control Tasks to Humans	Nov 25, 2022	Reinforcement Learning (RL)	CodeCode Available
Efficient Parallel Methods for Deep Reinforcement Learning	May 13, 2017	Deep Reinforcement LearningGPU	CodeCode Available
A Comparison of Reward Functions in Q-Learning Applied to a Cart Position Problem	May 25, 2021	PositionQ-Learning	CodeCode Available
Learning Bellman Complete Representations for Offline Policy Evaluation	Jul 12, 2022	continuous-controlContinuous Control	CodeCode Available
Agent-State Construction with Auxiliary Inputs	Nov 15, 2022	Decision Makingreinforcement-learning	CodeCode Available
Generalized Phase Pressure Control Enhanced Reinforcement Learning for Traffic Signal Control	Mar 26, 2025	Reinforcement Learning (RL)Traffic Signal Control	CodeCode Available
Assessing the Potential of Classical Q-learning in General Game Playing	Oct 14, 2018	Board GamesDeep Reinforcement Learning	CodeCode Available
Generalized Population-Based Training for Hyperparameter Optimization in Reinforcement Learning	Apr 12, 2024	Computational EfficiencyHyperparameter Optimization	CodeCode Available
AgentForge: A Flexible Low-Code Platform for Reinforcement Learning Agent Design	Oct 25, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available
Dealing with Sparse Rewards in Reinforcement Learning	Oct 21, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Efficient Probabilistic Performance Bounds for Inverse Reinforcement Learning	Jul 3, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
DDxT: Deep Generative Transformer Models for Differential Diagnosis	Dec 2, 2023	Reinforcement Learning (RL)Self-Supervised Learning	CodeCode Available
Assessing Generalization in Deep Reinforcement Learning	Oct 29, 2018	Deep Reinforcement LearningOut-of-Distribution Generalization	CodeCode Available
Learning to Perceive in Deep Model-Free Reinforcement Learning	Jan 10, 2023	Atari GamesHard Attention	CodeCode Available
Efficient reinforcement learning control for continuum robots based on Inexplicit Prior Knowledge	Feb 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Generalized Speedy Q-learning	Nov 1, 2019	Q-LearningReinforcement Learning	CodeCode Available
Can Agents Learn by Analogy? An Inferable Model for PAC Reinforcement Learning	Dec 21, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Calibrated Model-Based Deep Reinforcement Learning	Jun 19, 2019	Deep Reinforcement Learningmodel	CodeCode Available
Efficient Reinforcement Learning for Jumping Monopods	Sep 13, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
A Genetic Fuzzy System for Interpretable and Parsimonious Reinforcement Learning Policies	May 17, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available

Show:10 25 50

← PrevPage 291 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified