Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3876–3900 of 15113 papers

Title	Date	Tasks	Status	Score
DeepSynth: Automata Synthesis for Automatic Task Segmentation in Deep Reinforcement Learning	Nov 22, 2019	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
Deep TAMER: Interactive Agent Shaping in High-Dimensional State Spaces	Sep 28, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
BadRL: Sparse Targeted Backdoor Attack Against Reinforcement Learning	Dec 19, 2023	Backdoor Attackreinforcement-learning	CodeCode Available	5
DeepTPI: Test Point Insertion with Deep Reinforcement Learning	Jun 7, 2022	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	5
DeepTraffic: Crowdsourced Hyperparameter Tuning of Deep Reinforcement Learning Systems for Multi-Agent Dense Traffic Navigation	Jan 9, 2018	Autonomous DrivingAutonomous Navigation	CodeCode Available	5
CFlowNets: Continuous Control with Generative Flow Networks	Mar 4, 2023	Active Learningcontinuous-control	CodeCode Available	5
Deep Transfer Reinforcement Learning for Text Summarization	Oct 15, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
Answers Unite! Unsupervised Metrics for Reinforced Summarization Models	Sep 4, 2019	Abstractive Text SummarizationQuestion Answering	CodeCode Available	5
Deep Variational Reinforcement Learning for POMDPs	Jun 6, 2018	Decision MakingInductive Bias	CodeCode Available	5
Flight Controller Synthesis Via Deep Reinforcement Learning	Sep 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Deep Variation-structured Reinforcement Learning for Visual Relationship and Attribute Detection	Mar 8, 2017	Attributeimage-classification	CodeCode Available	5
Flexible Option Learning	Dec 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
Free energy-based reinforcement learning using a quantum processor	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Certified Policy Smoothing for Cooperative Multi-Agent Reinforcement Learning	Dec 22, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Deep W-Networks: Solving Multi-Objective Optimisation Problems With Deep Reinforcement Learning	Nov 9, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Certification of Iterative Predictions in Bayesian Neural Networks	May 21, 2021	Reinforcement Learning (RL)	CodeCode Available	5
Flappy Hummingbird: An Open Source Dynamic Simulation of Flapping Wing Robots and Animals	Feb 25, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
Defending Observation Attacks in Deep Reinforcement Learning via Detection and Denoising	Jun 14, 2022	continuous-controlContinuous Control	CodeCode Available	5
Semantic RL with Action Grammars: Data-Efficient Learning of Hierarchical Task Abstractions	Jul 29, 2019	Hierarchical Reinforcement LearningLogical Reasoning	CodeCode Available	5
Centralized Training with Hybrid Execution in Multi-Agent Reinforcement Learning	Oct 12, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Centralized Model and Exploration Policy for Multi-Agent RL	Jul 14, 2021	Reinforcement Learning (RL)	CodeCode Available	5
Fleet Control using Coregionalized Gaussian Process Policy Iteration	Nov 22, 2019	Gaussian Processesreinforcement-learning	CodeCode Available	5
CEM-GD: Cross-Entropy Method with Gradient Descent Planner for Model-Based Reinforcement Learning	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available	5
Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement Learning	Jul 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem	Feb 5, 2024	Montezuma's RevengeNetHack	CodeCode Available	5

Show:10 25 50

← PrevPage 156 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified