Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3726–3750 of 15113 papers

Title	Date	Tasks	Status	Score
Clipped-Objective Policy Gradients for Pessimistic Policy Optimization	Nov 10, 2023	Deep Reinforcement LearningMulti-Task Learning	CodeCode Available	5
Application of Self-Play Reinforcement Learning to a Four-Player Game of Imperfect Information	Aug 30, 2018	Card Gamesreinforcement-learning	CodeCode Available	5
Deep reinforcement learning for smart calibration of radio telescopes	Feb 5, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Climate Adaptation with Reinforcement Learning: Experiments with Flooding and Transportation in Copenhagen	Sep 27, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available	5
GAC: A Deep Reinforcement Learning Model Toward User Incentivization in Unknown Social Networks	Mar 17, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Client Selection for Federated Policy Optimization with Environment Heterogeneity	May 18, 2023	MuJoCoPolicy Gradient Methods	CodeCode Available	5
Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs	Jun 28, 2024	Reinforcement Learning (RL)	CodeCode Available	5
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available	5
Clickbait? Sensational Headline Generation with Auto-tuned Reinforcement Learning	Sep 9, 2019	Headline Generationreinforcement-learning	CodeCode Available	5
Fully Parameterized Quantile Function for Distributional Reinforcement Learning	Nov 5, 2019	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Functional Acceleration for Policy Mirror Descent	Jul 23, 2024	Reinforcement Learning (RL)	CodeCode Available	5
From Two-Dimensional to Three-Dimensional Environment with Q-Learning: Modeling Autonomous Navigation with Reinforcement Learning and no Libraries	Mar 27, 2024	Autonomous NavigationDecision Making	CodeCode Available	5
A Meta Reinforcement Learning Approach for Predictive Autoscaling in the Cloud	May 31, 2022	CPUDecision Making	CodeCode Available	5
Deep Reinforcement Learning for Tactile Robotics: Learning to Type on a Braille Keyboard	Aug 6, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Autoregressive Policies for Continuous Control Deep Reinforcement Learning	Mar 27, 2019	continuous-controlContinuous Control	CodeCode Available	5
AutoRL Hyperparameter Landscapes	Apr 5, 2023	AutoMLHyperparameter Optimization	CodeCode Available	5
Reinforcement Learning for Robot Navigation with Adaptive Forward Simulation Time (AFST) in a Semi-Markov Model	Aug 13, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Hierarchical Potential-based Reward Shaping from Task Specifications	Oct 6, 2021	Autonomous DrivingReinforcement Learning (RL)	CodeCode Available	5
Fully Convolutional Network with Multi-Step Reinforcement Learning for Image Processing	Nov 10, 2018	DenoisingImage Denoising	CodeCode Available	5
Classification with Costly Features using Deep Reinforcement Learning	Nov 20, 2017	ClassificationClassification with Costly Features	CodeCode Available	5
Classification with Costly Features as a Sequential Decision-Making Problem	Sep 5, 2019	ClassificationClassification with Costly Features	CodeCode Available	5
From Gameplay to Symbolic Reasoning: Learning SAT Solver Heuristics in the Style of Alpha(Go) Zero	Feb 14, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Reinforcement Learning Generalization with Surprise Minimization	Apr 26, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Deep Reinforcement Learning for Traffic Light Control in Vehicular Networks	Mar 29, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
From Images to Connections: Can DQN with GNNs learn the Strategic Game of Hex?	Nov 22, 2023	Board GamesInductive Bias	CodeCode Available	5

Show:10 25 50

← PrevPage 150 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified