Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3901–3925 of 15113 papers

Title	Date	Tasks	Status	Score
Certified Policy Smoothing for Cooperative Multi-Agent Reinforcement Learning	Dec 22, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Flight Controller Synthesis Via Deep Reinforcement Learning	Sep 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Certification of Iterative Predictions in Bayesian Neural Networks	May 21, 2021	Reinforcement Learning (RL)	CodeCode Available	5
Semantic RL with Action Grammars: Data-Efficient Learning of Hierarchical Task Abstractions	Jul 29, 2019	Hierarchical Reinforcement LearningLogical Reasoning	CodeCode Available	5
Safe Exploration Method for Reinforcement Learning under Existence of Disturbance	Sep 30, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Flexible Option Learning	Dec 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
Centralized Training with Hybrid Execution in Multi-Agent Reinforcement Learning	Oct 12, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Centralized Model and Exploration Policy for Multi-Agent RL	Jul 14, 2021	Reinforcement Learning (RL)	CodeCode Available	5
CEM-GD: Cross-Entropy Method with Gradient Descent Planner for Model-Based Reinforcement Learning	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available	5
Safe Model-based Reinforcement Learning with Stability Guarantees	May 23, 2017	modelModel-based Reinforcement Learning	CodeCode Available	5
Flappy Hummingbird: An Open Source Dynamic Simulation of Flapping Wing Robots and Animals	Feb 25, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available	5
CEIP: Combining Explicit and Implicit Priors for Reinforcement Learning with Demonstrations	Oct 18, 2022	Formreinforcement-learning	CodeCode Available	5
Fleet Control using Coregionalized Gaussian Process Policy Iteration	Nov 22, 2019	Gaussian Processesreinforcement-learning	CodeCode Available	5
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available	5
Safe Policy Optimization with Local Generalized Linear Function Approximations	Nov 9, 2021	Reinforcement Learning (RL)Safe Exploration	CodeCode Available	5
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem	Feb 5, 2024	Montezuma's RevengeNetHack	CodeCode Available	5
Safe reinforcement learning for probabilistic reachability and safety specifications: A Lyapunov-based approach	Feb 24, 2020	Autonomous Drivingcontinuous-control	CodeCode Available	5
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning	May 27, 2019	Q-Learningreinforcement-learning	CodeCode Available	5
A novel policy for pre-trained Deep Reinforcement Learning for Speech Emotion Recognition	Jan 4, 2021	Cross-corpusDeep Reinforcement Learning	CodeCode Available	5
Financial Trading as a Game: A Deep Reinforcement Learning Approach	Jul 8, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement Learning	Jul 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Few-Shot Image-to-Semantics Translation for Policy Transfer in Reinforcement Learning	Jan 31, 2023	Active LearningComputational Efficiency	CodeCode Available	5
FeUdal Networks for Hierarchical Reinforcement Learning	Mar 3, 2017	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Feudal Graph Reinforcement Learning	Apr 11, 2023	Decision MakingGraph Clustering	CodeCode Available	5

Show:10 25 50

← PrevPage 157 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified