Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5301–5350 of 15113 papers

Title	Date	Tasks	Status	Hype
GAN-based Intrinsic Exploration For Sample Efficient Reinforcement Learning	Jun 28, 2022	Efficient ExplorationGenerative Adversarial Network	—Unverified	0
EMVLight: a Multi-agent Reinforcement Learning Framework for an Emergency Vehicle Decentralized Routing and Traffic Signal Control System	Jun 27, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Humans are not Boltzmann Distributions: Challenges and Opportunities for Modelling Human Feedback and Interaction in Reinforcement Learning	Jun 27, 2022	Reinforcement Learning (RL)	—Unverified	0
Interpretable Hidden Markov Model-Based Deep Reinforcement Learning Hierarchical Framework for Predictive Maintenance of Turbofan Engines	Jun 27, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distinguishing Learning Rules with Brain Machine Interfaces	Jun 27, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
On the Complexity of Adversarial Decision Making	Jun 27, 2022	Decision Makingreinforcement-learning	—Unverified	0
When to Trust Your Simulator: Dynamics-Aware Hybrid Offline-and-Online Reinforcement Learning	Jun 27, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Predicting the Need for Blood Transfusion in Intensive Care Units with Reinforcement Learning	Jun 26, 2022	Decision MakingQ-Learning	—Unverified	0
Tackling Asymmetric and Circular Sequential Social Dilemmas with Reinforcement Learning and Graph-based Tit-for-Tat	Jun 26, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Improving Policy Optimization with Generalist-Specialist Learning	Jun 26, 2022	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Analysis of Stochastic Processes through Replay Buffers	Jun 26, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Estimating Link Flows in Road Networks with Synthetic Trajectory Data Generation: Reinforcement Learning-based Approaches	Jun 26, 2022	Decision Makingreinforcement-learning	—Unverified	0
Functional Optimization Reinforcement Learning for Real-Time Bidding	Jun 25, 2022	AttributeMulti-agent Reinforcement Learning	—Unverified	0
Guided Exploration in Reinforcement Learning via Monte Carlo Critic Optimization	Jun 25, 2022	continuous-controlContinuous Control	CodeCode Available	0
Hierarchical Reinforcement Learning with Opponent Modeling for Distributed Multi-agent Cooperation	Jun 25, 2022	Autonomous VehiclesDecision Making	—Unverified	0
Value-Consistent Representation Learning for Data-Efficient Reinforcement Learning	Jun 25, 2022	Contrastive LearningData Augmentation	—Unverified	0
Towards Modern Card Games with Large-Scale Action Spaces Through Action Representation	Jun 25, 2022	Card Gamesreinforcement-learning	—Unverified	0
Value Function Decomposition for Iterative Design of Reinforcement Learning Agents	Jun 24, 2022	Decision Makingreinforcement-learning	—Unverified	0
Provably Efficient Reinforcement Learning in Partially Observable Dynamical Systems	Jun 24, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement learning based adaptive metaheuristics	Jun 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
Modeling Adaptive Platoon and Reservation Based Autonomous Intersection Control: A Deep Reinforcement Learning Approach	Jun 24, 2022	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Joint Representation Training in Sequential Tasks with Shared Structure	Jun 24, 2022	Multi-Armed BanditsReinforcement Learning (RL)	—Unverified	0
Dynamic network congestion pricing based on deep reinforcement learning	Jun 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning the policy for mixed electric platoon control of automated and human-driven vehicles at signalized intersection: a random search approach	Jun 24, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Eco-driving for Electric Connected Vehicles at Signalized Intersections: A Parameterized Reinforcement Learning approach	Jun 24, 2022	Reinforcement Learning (RL)	—Unverified	0
Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement Learning	Jun 24, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning under Partial Observability Guided by Learned Environment Models	Jun 23, 2022	Q-Learningreinforcement-learning	—Unverified	0
Recursive Reinforcement Learning	Jun 23, 2022	IngenuityQ-Learning	—Unverified	0
The Real Deal: A Review of Challenges and Opportunities in Moving Reinforcement Learning-Based Traffic Signal Control Systems Towards Reality	Jun 23, 2022	Reinforcement Learning (RL)Traffic Signal Control	—Unverified	0
Nearly Minimax Optimal Reinforcement Learning with Linear Function Approximation	Jun 23, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos	Jun 23, 2022	Imitation LearningMinecraft	CodeCode Available	3
Learning Agile Skills via Adversarial Imitation of Rough Partial Demonstrations	Jun 23, 2022	Reinforcement Learning (RL)	—Unverified	0
CGAR: Critic Guided Action Redistribution in Reinforcement Leaning	Jun 23, 2022	MuJoCoReinforcement Learning (RL)	CodeCode Available	0
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified	0
Multi-Agent Car Parking using Reinforcement Learning	Jun 22, 2022	Autonomous DrivingForm	CodeCode Available	1
Optimistic Linear Support and Successor Features as a Basis for Optimal Policy Transfer	Jun 22, 2022	Reinforcement Learning (RL)Transfer Learning	CodeCode Available	0
Constrained Stochastic Nonconvex Optimization with State-dependent Markov Data	Jun 22, 2022	Reinforcement Learning (RL)Stochastic Optimization	—Unverified	0
PAC: Assisted Value Factorisation with Counterfactual Predictions in Multi-Agent Reinforcement Learning	Jun 22, 2022	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	0
Auto-Encoding Adversarial Imitation Learning	Jun 22, 2022	Decision MakingImitation Learning	—Unverified	0
Multi-Horizon Representations with Hierarchical Forward Models for Reinforcement Learning	Jun 22, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Decentralized Gossip-Based Stochastic Bilevel Optimization over Communication Networks	Jun 22, 2022	Bilevel OptimizationFederated Learning	—Unverified	0
Curious Exploration via Structured World Models Yields Zero-Shot Object Manipulation	Jun 22, 2022	Efficient ExplorationObject	—Unverified	0
Fusion of Model-free Reinforcement Learning with Microgrid Control: Review and Vision	Jun 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning Optimal Treatment Strategies for Sepsis Using Offline Reinforcement Learning in Continuous Space	Jun 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Turbulence Modeling in Large Eddy Simulations	Jun 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Imitate then Transcend: Multi-Agent Optimal Execution with Dual-Window Denoise PPO	Jun 21, 2022	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Meta Reinforcement Learning with Finite Training Tasks -- a Density Estimation Approach	Jun 21, 2022	Density EstimationDimensionality Reduction	CodeCode Available	0
On the Statistical Efficiency of Reward-Free Exploration in Non-Linear RL	Jun 21, 2022	Reinforcement Learning (RL)	—Unverified	0
Robust Task Representations for Offline Meta-Reinforcement Learning via Contrastive Learning	Jun 21, 2022	Contrastive LearningMeta Reinforcement Learning	CodeCode Available	1
Safe and Psychologically Pleasant Traffic Signal Control with Reinforcement Learning using Action Masking	Jun 21, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 107 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified