Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3725 of 15113 papers

Title	Date	Tasks	Status	Score
Generalization in Reinforcement Learning with Selective Noise Injection and Information Bottleneck	Oct 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Deep Reinforcement Learning for Programming Language Correction	Jan 31, 2018	Deep Reinforcement LearningMachine Translation	CodeCode Available	5
Generalised Discount Functions applied to a Monte-Carlo AImu Implementation	Mar 3, 2017	General Reinforcement Learningreinforcement-learning	CodeCode Available	5
Applying Deep Reinforcement Learning to the HP Model for Protein Structure Prediction	Nov 27, 2022	Deep Reinforcement LearningProtein Folding	CodeCode Available	5
Generalization in Text-based Games via Hierarchical Reinforcement Learning	Sep 21, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
Cloud Database Tuning with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	CodeCode Available	5
Gap-Dependent Unsupervised Exploration for Reinforcement Learning	Aug 11, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
GAN Q-learning	May 13, 2018	Distributional Reinforcement LearningOpenAI Gym	CodeCode Available	5
GAC: A Deep Reinforcement Learning Model Toward User Incentivization in Unknown Social Networks	Mar 17, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Entropy Regularized Reinforcement Learning Using Large Deviation Theory	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Accelerate Reinforcement Learning with PID Controllers in the Pendulum Simulations	Oct 3, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Gaussian Processes for Data-Efficient Learning in Robotics and Control	Feb 10, 2015	Gaussian ProcessesReinforcement Learning	CodeCode Available	5
Generalization in Visual Reinforcement Learning with the Reward Sequence Distribution	Feb 19, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer	May 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Autonomous Soft Tissue Retraction Using Demonstration-Guided Reinforcement Learning	Sep 2, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Reinforcement Learning Decoders for Fault-Tolerant Quantum Computation	Oct 16, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
Clipped-Objective Policy Gradients for Pessimistic Policy Optimization	Nov 10, 2023	Deep Reinforcement LearningMulti-Task Learning	CodeCode Available	5
Application of Self-Play Reinforcement Learning to a Four-Player Game of Imperfect Information	Aug 30, 2018	Card Gamesreinforcement-learning	CodeCode Available	5
Climate Adaptation with Reinforcement Learning: Experiments with Flooding and Transportation in Copenhagen	Sep 27, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available	5
Fully Parameterized Quantile Function for Distributional Reinforcement Learning	Nov 5, 2019	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Client Selection for Federated Policy Optimization with Environment Heterogeneity	May 18, 2023	MuJoCoPolicy Gradient Methods	CodeCode Available	5
Deep Reinforcement Learning for Sepsis Treatment	Nov 27, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Fully Convolutional Network with Multi-Step Reinforcement Learning for Image Processing	Nov 10, 2018	DenoisingImage Denoising	CodeCode Available	5
Functional Acceleration for Policy Mirror Descent	Jul 23, 2024	Reinforcement Learning (RL)	CodeCode Available	5
Clickbait? Sensational Headline Generation with Auto-tuned Reinforcement Learning	Sep 9, 2019	Headline Generationreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 149 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified