Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 931–940 of 15113 papers

Title	Date	Tasks	Status	Hype
On the Feasibility of Cross-Task Transfer with Model-Based Reinforcement Learning	Oct 19, 2022	Atari Games 100kModel-based Reinforcement Learning	CodeCode Available	1
Rethinking Value Function Learning for Generalization in Reinforcement Learning	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Curriculum Reinforcement Learning using Optimal Transport via Gradual Domain Adaptation	Oct 18, 2022	Domain Adaptationreinforcement-learning	CodeCode Available	1
Teacher Forcing Recovers Reward Functions for Text Generation	Oct 17, 2022	regressionreinforcement-learning	CodeCode Available	1
On Uncertainty in Deep State Space Models for Model-Based Reinforcement Learning	Oct 17, 2022	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
When to Update Your Model: Constrained Model-based Reinforcement Learning	Oct 15, 2022	modelModel-based Reinforcement Learning	CodeCode Available	1
A Policy-Guided Imitation Approach for Offline Reinforcement Learning	Oct 15, 2022	D4RLOffline RL	CodeCode Available	1
Model-based Safe Deep Reinforcement Learning via a Constrained Proximal Policy Optimization Algorithm	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
ToupleGDD: A Fine-Designed Solution of Influence Maximization by Deep Reinforcement Learning	Oct 14, 2022	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 94 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified