Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3725 of 15113 papers

Title	Date	Tasks	Status	Hype
Sim-and-Real Reinforcement Learning for Manipulation: A Consensus-based Approach	Feb 26, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Limited Query Graph Connectivity Test	Feb 25, 2023	Reinforcement Learning (RL)	—Unverified	0
A Human-Centered Safe Robot Reinforcement Learning Framework with Interactive Behaviors	Feb 25, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Exponential Hardness of Reinforcement Learning with Linear Function Approximation	Feb 25, 2023	Learning Theoryreinforcement-learning	—Unverified	0
On Bellman's principle of optimality and Reinforcement learning for safety-constrained Markov decision process	Feb 25, 2023	Q-Learningreinforcement-learning	—Unverified	0
Finding Regularized Competitive Equilibria of Heterogeneous Agent Macroeconomic Models with Reinforcement Learning	Feb 24, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
The Dormant Neuron Phenomenon in Deep Reinforcement Learning	Feb 24, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	6
Logarithmic Switching Cost in Reinforcement Learning beyond Linear MDPs	Feb 24, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
GANterfactual-RL: Understanding Reinforcement Learning Agents' Strategies through Visual Counterfactual Explanations	Feb 24, 2023	counterfactualDecision Making	CodeCode Available	1
GraphSR: A Data Augmentation Algorithm for Imbalanced Node Classification	Feb 24, 2023	ClassificationData Augmentation	—Unverified	0
Neural Laplace Control for Continuous-time Delayed Systems	Feb 24, 2023	Model Predictive ControlOffline RL	CodeCode Available	1
Model-Based Uncertainty in Value Functions	Feb 24, 2023	continuous-controlContinuous Control	CodeCode Available	1
EvoTorch: Scalable Evolutionary Computation in Python	Feb 24, 2023	GPUreinforcement-learning	CodeCode Available	3
Multi-Agent Reinforcement Learning with Common Policy for Antenna Tilt Optimization	Feb 24, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Leveraging Jumpy Models for Planning and Fast Learning in Robotic Domains	Feb 24, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
AC2C: Adaptively Controlled Two-Hop Communication for Multi-Agent Reinforcement Learning	Feb 24, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
VIPeR: Provably Efficient Algorithm for Offline RL with Neural Function Approximation	Feb 24, 2023	Computational EfficiencyOffline RL	CodeCode Available	0
Energy Harvesting Reconfigurable Intelligent Surface for UAV Based on Robust Deep Reinforcement Learning	Feb 23, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Diverse Policy Optimization for Structured Action Space	Feb 23, 2023	DiversityReinforcement Learning (RL)	CodeCode Available	1
To the Noise and Back: Diffusion for Shared Autonomy	Feb 23, 2023	continuous-controlContinuous Control	—Unverified	0
Concept Learning for Interpretable Multi-Agent Reinforcement Learning	Feb 23, 2023	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Reinforcement Learning for Combining Search Methods in the Calibration of Economic ABMs	Feb 23, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Behavior Proximal Policy Optimization	Feb 22, 2023	D4RLOffline RL	CodeCode Available	1
Towards Decentralized Predictive Quality of Service in Next-Generation Vehicular Networks	Feb 22, 2023	Federated LearningReinforcement Learning (RL)	—Unverified	0
Self-supervised network distillation: an effective approach to exploration in sparse reward environments	Feb 22, 2023	Atari GamesDecision Making	CodeCode Available	0

Show:10 25 50

← PrevPage 149 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified