Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–525 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Deep Reinforcement Learning for Turbulence Modeling in Large Eddy Simulations	Jun 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Toward Deep Supervised Anomaly Detection: Reinforcement Learning from Partially Labeled Anomaly Data	Sep 15, 2020	Anomaly DetectionDeep Reinforcement Learning	CodeCode Available	1	5
DataLight: Offline Data-Driven Traffic Signal Control	Mar 20, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1	5
Barrier Certified Safety Learning Control: When Sum-of-Square Programming Meets Reinforcement Learning	Jun 16, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
A Composable Specification Language for Reinforcement Learning Tasks	Aug 21, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Distributed Multi-Agent Reinforcement Learning with One-hop Neighbors and Compute Straggler Mitigation	Feb 18, 2022	Distributed ComputingMulti-agent Reinforcement Learning	CodeCode Available	1	5
A Comprehensive Survey of Data Augmentation in Visual Reinforcement Learning	Oct 10, 2022	Data Augmentationreinforcement-learning	CodeCode Available	1	5
Adaptive Transformers in RL	Apr 8, 2020	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Battlesnake Challenge: A Multi-agent Reinforcement Learning Playground with Human-in-the-loop	Jul 20, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Batch Exploration with Examples for Scalable Robotic Reinforcement Learning	Oct 22, 2020	Offline RLreinforcement-learning	CodeCode Available	1	5
A SWAT-based Reinforcement Learning Framework for Crop Management	Feb 10, 2023	BenchmarkingDecision Making	CodeCode Available	1	5
Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning	Dec 4, 2019	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1	5
Asynchronous Methods for Deep Reinforcement Learning	Feb 4, 2016	Atari GamesCPU	CodeCode Available	1	5
DARTS: Differentiable Architecture Search	Jun 24, 2018	General Classificationimage-classification	CodeCode Available	1	5
Dataset Reset Policy Optimization for RLHF	Apr 12, 2024	Reinforcement Learning (RL)	CodeCode Available	1	5
Curriculum-based Reinforcement Learning for Distribution System Critical Load Restoration	Mar 8, 2022	Decision Makingreinforcement-learning	CodeCode Available	1	5
Curriculum Offline Imitation Learning	Nov 3, 2021	continuous-controlContinuous Control	CodeCode Available	1	5
CurricuLLM: Automatic Task Curricula Design for Learning Complex Robot Skills using Large Language Models	Sep 27, 2024	Reinforcement Learning (RL)World Knowledge	CodeCode Available	1	5
Stable and Safe Reinforcement Learning via a Barrier-Lyapunov Actor-Critic Approach	Apr 8, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1	5
Curriculum-based Asymmetric Multi-task Reinforcement Learning	Nov 7, 2022	Multi-Task Learningreinforcement-learning	CodeCode Available	1	5
Curriculum Reinforcement Learning using Optimal Transport via Gradual Domain Adaptation	Oct 18, 2022	Domain Adaptationreinforcement-learning	CodeCode Available	1	5
Curious Hierarchical Actor-Critic Reinforcement Learning	May 7, 2020	BenchmarkingHierarchical Reinforcement Learning	CodeCode Available	1	5
CURL: Contrastive Unsupervised Representation Learning for Reinforcement Learning	Jan 1, 2020	Contrastive Learningreinforcement-learning	CodeCode Available	1	5
A Sustainable Ecosystem through Emergent Cooperation in Multi-Agent Reinforcement Learning	Jul 19, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Curiosity-Driven Energy-Efficient Worker Scheduling in Vehicular Crowdsourcing: A Deep Reinforcement Learning Approach	Apr 24, 2020	Deep Reinforcement LearningFairness	CodeCode Available	1	5

Show:10 25 50

← PrevPage 21 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified