Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–3975 of 15113 papers

Title	Date	Tasks	Status	Score
Accelerated Reinforcement Learning for Sentence Generation by Vocabulary Prediction	Sep 5, 2018	GPUImage Captioning	CodeCode Available	5
Causal Reasoning from Meta-reinforcement Learning	Jan 23, 2019	counterfactualMeta Reinforcement Learning	CodeCode Available	5
Few-shot Quality-Diversity Optimization	Sep 14, 2021	DiversityMeta-Learning	CodeCode Available	5
Few-Shot Image-to-Semantics Translation for Policy Transfer in Reinforcement Learning	Jan 31, 2023	Active LearningComputational Efficiency	CodeCode Available	5
FFNet: Video Fast-Forwarding via Reinforcement Learning	May 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
FeUdal Networks for Hierarchical Reinforcement Learning	Mar 3, 2017	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Feudal Graph Reinforcement Learning	Apr 11, 2023	Decision MakingGraph Clustering	CodeCode Available	5
Financial Trading as a Game: A Deep Reinforcement Learning Approach	Jul 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Feature-Attending Recurrent Modules for Generalization in Reinforcement Learning	Dec 15, 2021	Objectreinforcement-learning	CodeCode Available	5
A Novel Approach to Curiosity and Explainable Reinforcement Learning via Interpretable Sub-Goals	Apr 14, 2021	Generative Adversarial Networkreinforcement-learning	CodeCode Available	5
FCMNet: Full Communication Memory Net for Team-Level Cooperation in Multi-Agent Systems	Jan 28, 2022	Decision Makingreinforcement-learning	CodeCode Available	5
Feature Control as Intrinsic Motivation for Hierarchical Reinforcement Learning	May 18, 2017	Hierarchical Reinforcement LearningMontezuma's Revenge	CodeCode Available	5
Fast Rates for Maximum Entropy Exploration	Mar 14, 2023	Reinforcement Learning (RL)	CodeCode Available	5
Faults in Deep Reinforcement Learning Programs: A Taxonomy and A Detection Approach	Jan 1, 2021	Deep Reinforcement LearningFault Detection	CodeCode Available	5
Faster Reinforcement Learning Using Active Simulators	Mar 22, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Self-Learning Exploration and Mapping for Mobile Robots via Deep Reinforcement Learning	Jan 6, 2019	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	5
Action-depedent Control Variates for Policy Optimization via Stein's Identity	Oct 30, 2017	Policy Gradient Methodsreinforcement-learning	CodeCode Available	5
Federated Control with Hierarchical Multi-Agent Deep Reinforcement Learning	Dec 22, 2017	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	5
Flexible Option Learning	Dec 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
GAC: A Deep Reinforcement Learning Model Toward User Incentivization in Unknown Social Networks	Mar 17, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
FairStream: Fair Multimedia Streaming Benchmark for Reinforcement Learning Agents	Oct 28, 2024	Fairnessreinforcement-learning	CodeCode Available	5
Fantastic Rewards and How to Tame Them: A Case Study on Reward Learning for Task-oriented Dialogue Systems	Feb 20, 2023	Learning-To-RankReinforcement Learning (RL)	CodeCode Available	5
MEDIRL: Predicting the Visual Attention of Drivers via Maximum Entropy Deep Inverse Reinforcement Learning	Dec 17, 2019	Autonomous Vehiclesreinforcement-learning	CodeCode Available	5
Semifactual Explanations for Reinforcement Learning	Sep 9, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Causal Campbell-Goodhart's law and Reinforcement Learning	Nov 2, 2020	Causal InferenceDecision Making	CodeCode Available	5

Show:10 25 50

← PrevPage 159 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified