Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1081–1090 of 15113 papers

Title	Date	Tasks	Status	Hype
Mildly Conservative Q-Learning for Offline Reinforcement Learning	Jun 9, 2022	D4RLQ-Learning	CodeCode Available	1
A Relational Intervention Approach for Unsupervised Dynamics Generalization in Model-Based Reinforcement Learning	Jun 9, 2022	Model-based Reinforcement LearningPrediction	CodeCode Available	1
Value Memory Graph: A Graph-Structured World Model for Offline Reinforcement Learning	Jun 9, 2022	D4RLModel-based Reinforcement Learning	CodeCode Available	1
Stabilizing Voltage in Power Distribution Networks via Multi-Agent Reinforcement Learning with Transformer	Jun 8, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
How Far I'll Go: Offline Goal-Conditioned Reinforcement Learning via f-Advantage Regression	Jun 7, 2022	regressionreinforcement-learning	CodeCode Available	1
RORL: Robust Offline Reinforcement Learning via Conservative Smoothing	Jun 6, 2022	Decision MakingOffline RL	CodeCode Available	1
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress	Jun 3, 2022	Atari GamesHumanoid Control	CodeCode Available	1
Deep Transformer Q-Networks for Partially Observable Reinforcement Learning	Jun 2, 2022	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available	1
NeuralSympCheck: A Symptom Checking and Disease Diagnostic Neural Model with Logic Regularization	Jun 2, 2022	DiagnosticReinforcement Learning (RL)	CodeCode Available	1
When does return-conditioned supervised learning work for offline reinforcement learning?	Jun 2, 2022	D4RLreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 109 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified