Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14201–14250 of 15113 papers

Title	Date	Tasks	Status
AdCraft: An Advanced Reinforcement Learning Benchmark Environment for Search Engine Marketing Optimization	Jun 21, 2023	ManagementMarketing	CodeCode Available
Deep Reinforcement Learning for Cybersecurity Assessment of Wind Integrated Power Systems	Nov 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Cold-Start Reinforcement Learning with Softmax Policy Gradient	Sep 27, 2017	Image CaptioningPolicy Gradient Methods	CodeCode Available
CODEX: A Cluster-Based Method for Explainable Reinforcement Learning	Dec 7, 2023	Clusteringcounterfactual	CodeCode Available
COBRA: Data-Efficient Model-Based RL through Unsupervised Object Discovery and Curiosity-Driven Exploration	May 22, 2019	continuous-controlContinuous Control	CodeCode Available
AdaStop: adaptive statistical testing for sound comparisons of Deep RL agents	Jun 19, 2023	Deep Reinforcement LearningMuJoCo	CodeCode Available
AutoFS: Automated Feature Selection via Diversity-aware Interactive Reinforcement Learning	Aug 27, 2020	Diversityfeature selection	CodeCode Available
An Object-Oriented Representation for Efficient Reinforcement Learning	Jul 1, 2008	Objectreinforcement-learning	CodeCode Available
AutoBS: Autonomous Base Station Deployment with Reinforcement Learning and Digital Network Twins	Feb 27, 2025	Reinforcement Learning (RL)	CodeCode Available
CoaCor: Code Annotation for Code Retrieval with Reinforcement Learning	Mar 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Weak Human Preference Supervision For Deep Reinforcement Learning	Jul 25, 2020	Deep Reinforcement LearningMuJoCo	CodeCode Available
Learning to Fly via Deep Model-Based Reinforcement Learning	Mar 19, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Learning on a Budget via Teacher Imitation	Apr 17, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Learning To Follow Directions in Street View	Mar 1, 2019	Deep Reinforcement LearningInstruction Following	CodeCode Available
A Hitchhiker's Guide to Statistical Comparisons of Reinforcement Learning Algorithms	Apr 15, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Learning on One Mode: Addressing Multi-Modality in Offline Reinforcement Learning	Dec 4, 2024	D4RLImitation Learning	CodeCode Available
DOM-Q-NET: Grounded RL on Structured Language	Feb 19, 2019	Deep Reinforcement LearningGraph Neural Network	CodeCode Available
Learning to Follow Instructions in Text-Based Games	Nov 8, 2022	Decision MakingInstruction Following	CodeCode Available
A Cramér Distance perspective on Quantile Regression based Distributional Reinforcement Learning	Oct 1, 2021	Distributional Reinforcement Learningquantile regression	CodeCode Available
Deep Reinforcement Learning for Control of Probabilistic Boolean Networks	Sep 7, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
Deep Reinforcement Learning for Chinese Zero pronoun Resolution	Jun 10, 2018	Chinese Zero Pronoun ResolutionDecision Making	CodeCode Available
Learning to Generalize for Sequential Decision Making	Oct 5, 2020	Decision MakingImitation Learning	CodeCode Available
Coach-assisted Multi-Agent Reinforcement Learning Framework for Unexpected Crashed Agents	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Hybrid Actor-Critic Reinforcement Learning in Parameterized Action Space	Mar 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent	Jun 2, 2020	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Accelerate Reinforcement Learning with PID Controllers in the Pendulum Simulations	Oct 3, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Autonomous Driving	Nov 28, 2018	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available
CM3: Cooperative Multi-goal Multi-stage Multi-agent Reinforcement Learning	Sep 13, 2018	Autonomous VehiclesEfficient Exploration	CodeCode Available
Flappy Hummingbird: An Open Source Dynamic Simulation of Flapping Wing Robots and Animals	Feb 25, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
DoorGym: A Scalable Door Opening Environment And Baseline Agent	Aug 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Deep Reinforcement Learning for Conversational AI	Sep 15, 2017	Deep LearningDeep Reinforcement Learning	CodeCode Available
Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning	Feb 10, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
DORA The Explorer: Directed Outreaching Reinforcement Action-Selection	Apr 11, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
DORA: Toward Policy Optimization for Task-oriented Dialogue System with Efficient Context	Jul 7, 2021	Reinforcement Learning (RL)Task-Oriented Dialogue Systems	CodeCode Available
Adapting to Reward Progressivity via Spectral Reinforcement Learning	Apr 29, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Learning Transferable Reward for Query Object Localization with Policy Adaptation	Feb 24, 2022	Metric LearningObject Localization	CodeCode Available
Dota 2 with Large Scale Deep Reinforcement Learning	Dec 13, 2019	Deep Reinforcement LearningDota 2	CodeCode Available
Fleet Control using Coregionalized Gaussian Process Policy Iteration	Nov 22, 2019	Gaussian Processesreinforcement-learning	CodeCode Available
Leveraging Fully Observable Policies for Learning under Partial Observability	Nov 3, 2022	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available
Double Check Your State Before Trusting It: Confidence-Aware Bidirectional Offline Model-Based Imagination	Jun 16, 2022	D4RLOffline RL	CodeCode Available
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Estimators for Reinforcement Learning	Sep 23, 2019	continuous-controlContinuous Control	CodeCode Available
CLUTR: Curriculum Learning via Unsupervised Task Representation Learning	Oct 19, 2022	Reinforcement Learning (RL)Representation Learning	CodeCode Available
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Gradient Estimators for Reinforcement Learning	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available
Learning to solve the credit assignment problem	Jun 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Double Reinforcement Learning for Efficient Off-Policy Evaluation in Markov Decision Processes	Aug 22, 2019	Off-policy evaluationreinforcement-learning	CodeCode Available
Flexible Option Learning	Dec 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available
Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning	Sep 10, 2024	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Doubly Inhomogeneous Reinforcement Learning	Nov 8, 2022	Change Point DetectionClustering	CodeCode Available
Deep Reinforcement Learning Based Parameter Control in Differential Evolution	May 20, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
Cloud Database Tuning with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 285 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified