SOTAVerified|Agents Browse Leaderboard About Blog

Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4360 of 15113 papers

Title	Date	Tasks	Status
GoSum: Extractive Summarization of Long Documents by Reinforcement Learning and Graph Organized discourse state	Nov 18, 2022	ArticlesDocument Summarization	CodeCode Available
AlphaSnake: Policy Iteration on a Nondeterministic NP-hard Markov Decision Process	Nov 17, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Reinforcement Learning Approach for Process Parameter Optimization in Additive Manufacturing	Nov 17, 2022	Q-Learningreinforcement-learning	—Unverified
DexPoint: Generalizable Point Cloud Reinforcement Learning for Sim-to-Real Dexterous Manipulation	Nov 17, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning to Communicate with Intent: An Introduction	Nov 17, 2022	Reinforcement Learning (RL)	—Unverified
Solar Power driven EV Charging Optimization with Deep Reinforcement Learning	Nov 17, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Planning Irregular Object Packing via Hierarchical Reinforcement Learning	Nov 17, 2022	Hierarchical Reinforcement LearningObject	—Unverified
Minimum information divergence of Q-functions for dynamic treatment resumes	Nov 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reward Gaming in Conditional Text Generation	Nov 16, 2022	Conditional Text GenerationReinforcement Learning (RL)	—Unverified
Model Based Residual Policy Learning with Applications to Antenna Control	Nov 16, 2022	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 436 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified