Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3926–3950 of 15113 papers

Title	Date	Tasks	Status	Score
CEM-GD: Cross-Entropy Method with Gradient Descent Planner for Model-Based Reinforcement Learning	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available	5
Flight Controller Synthesis Via Deep Reinforcement Learning	Sep 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available	5
CEIP: Combining Explicit and Implicit Priors for Reinforcement Learning with Demonstrations	Oct 18, 2022	Formreinforcement-learning	CodeCode Available	5
Fleet Control using Coregionalized Gaussian Process Policy Iteration	Nov 22, 2019	Gaussian Processesreinforcement-learning	CodeCode Available	5
Flexible Option Learning	Dec 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
Free energy-based reinforcement learning using a quantum processor	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
A novel policy for pre-trained Deep Reinforcement Learning for Speech Emotion Recognition	Jan 4, 2021	Cross-corpusDeep Reinforcement Learning	CodeCode Available	5
Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement Learning	Jul 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning	May 27, 2019	Q-Learningreinforcement-learning	CodeCode Available	5
Causal State Distillation for Explainable Reinforcement Learning	Dec 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Financial Trading as a Game: A Deep Reinforcement Learning Approach	Jul 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Accelerated Reinforcement Learning for Sentence Generation by Vocabulary Prediction	Sep 5, 2018	GPUImage Captioning	CodeCode Available	5
Causal Reasoning from Meta-reinforcement Learning	Jan 23, 2019	counterfactualMeta Reinforcement Learning	CodeCode Available	5
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem	Feb 5, 2024	Montezuma's RevengeNetHack	CodeCode Available	5
FeUdal Networks for Hierarchical Reinforcement Learning	Mar 3, 2017	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Deployable Reinforcement Learning with Variable Control Rate	Jan 17, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Feudal Graph Reinforcement Learning	Apr 11, 2023	Decision MakingGraph Clustering	CodeCode Available	5
Few-Shot Image-to-Semantics Translation for Policy Transfer in Reinforcement Learning	Jan 31, 2023	Active LearningComputational Efficiency	CodeCode Available	5
Feature Control as Intrinsic Motivation for Hierarchical Reinforcement Learning	May 18, 2017	Hierarchical Reinforcement LearningMontezuma's Revenge	CodeCode Available	5
Feature-Attending Recurrent Modules for Generalization in Reinforcement Learning	Dec 15, 2021	Objectreinforcement-learning	CodeCode Available	5
Federated Control with Hierarchical Multi-Agent Deep Reinforcement Learning	Dec 22, 2017	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	5
Few-shot Quality-Diversity Optimization	Sep 14, 2021	DiversityMeta-Learning	CodeCode Available	5
Faults in Deep Reinforcement Learning Programs: A Taxonomy and A Detection Approach	Jan 1, 2021	Deep Reinforcement LearningFault Detection	CodeCode Available	5
FCMNet: Full Communication Memory Net for Team-Level Cooperation in Multi-Agent Systems	Jan 28, 2022	Decision Makingreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 158 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified