Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3751–3775 of 15113 papers

Title	Date	Tasks	Status	Score
Client Selection for Federated Policy Optimization with Environment Heterogeneity	May 18, 2023	MuJoCoPolicy Gradient Methods	CodeCode Available	5
Clickbait? Sensational Headline Generation with Auto-tuned Reinforcement Learning	Sep 9, 2019	Headline Generationreinforcement-learning	CodeCode Available	5
Gap-Dependent Unsupervised Exploration for Reinforcement Learning	Aug 11, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available	5
GAC: A Deep Reinforcement Learning Model Toward User Incentivization in Unknown Social Networks	Mar 17, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Classification with Costly Features using Deep Reinforcement Learning	Nov 20, 2017	ClassificationClassification with Costly Features	CodeCode Available	5
Classification with Costly Features as a Sequential Decision-Making Problem	Sep 5, 2019	ClassificationClassification with Costly Features	CodeCode Available	5
Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs	Jun 28, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Gaussian Processes for Data-Efficient Learning in Robotics and Control	Feb 10, 2015	Gaussian ProcessesReinforcement Learning	CodeCode Available	5
Functional Acceleration for Policy Mirror Descent	Jul 23, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Fully Parameterized Quantile Function for Distributional Reinforcement Learning	Nov 5, 2019	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Reinforcement Learning Upside Down: Don't Predict Rewards -- Just Map Them to Actions	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Fully Convolutional Network with Multi-Step Reinforcement Learning for Image Processing	Nov 10, 2018	DenoisingImage Denoising	CodeCode Available	5
Deep Reinforcement Learning from Hierarchical Preference Design	Sep 6, 2023	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
From Two-Dimensional to Three-Dimensional Environment with Q-Learning: Modeling Autonomous Navigation with Reinforcement Learning and no Libraries	Mar 27, 2024	Autonomous NavigationDecision Making	CodeCode Available	5
Deep reinforcement learning from human preferences	Jun 12, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Adaptive Power System Emergency Control using Deep Reinforcement Learning	Mar 9, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	5
Action Robust Reinforcement Learning and Applications in Continuous Control	Jan 26, 2019	continuous-controlContinuous Control	CodeCode Available	5
From Perceptions to Decisions: Wildfire Evacuation Decision Prediction with Behavioral Theory-informed LLMs	Feb 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	5
Hierarchical Potential-based Reward Shaping from Task Specifications	Oct 6, 2021	Autonomous DrivingReinforcement Learning (RL)	CodeCode Available	5
CityFlow: A Multi-Agent Reinforcement Learning Environment for Large Scale City Traffic Scenario	May 13, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
A Policy Gradient Primal-Dual Algorithm for Constrained MDPs with Uniform PAC Guarantees	Jan 31, 2024	Reinforcement Learning (RL)	CodeCode Available	5
From Gameplay to Symbolic Reasoning: Learning SAT Solver Heuristics in the Style of Alpha(Go) Zero	Feb 14, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Circular Microalgae-Based Carbon Control for Net Zero	Feb 4, 2025	Reinforcement Learning (RL)	CodeCode Available	5
A policy gradient approach for Finite Horizon Constrained Markov Decision Processes	Oct 10, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 151 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified