Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4376–4400 of 15113 papers

Title	Date	Tasks	Status	Score
Reinforcement Learning based Collective Entity Alignment with Adaptive Features	Jan 5, 2021	Decision MakingEntity Alignment	CodeCode Available	5
Playing FPS Games with Deep Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningFPS Games	CodeCode Available	5
Universal Value Density Estimation for Imitation Learning and Goal-Conditioned Reinforcement Learning	Feb 15, 2020	Density EstimationImitation Learning	CodeCode Available	5
Playing Games in the Dark: An approach for cross-modality transfer in reinforcement learning	Nov 28, 2019	OpenAI Gymreinforcement-learning	CodeCode Available	5
Near Optimal Behavior via Approximate State Abstraction	Jan 15, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning	Dec 4, 2018	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	5
Sample Complexity of Robust Reinforcement Learning with a Generative Model	Dec 2, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	5
Near-optimal Deep Reinforcement Learning Policies from Data for Zone Temperature Control	Mar 10, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Unpaired Sentiment-to-Sentiment Translation: A Cycled Reinforcement Learning Approach	May 14, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
PlotMap: Automated Layout Design for Building Game Worlds	Sep 26, 2023	Decision MakingLayout Design	CodeCode Available	5
Contrastive Multi-document Question Generation	Nov 8, 2019	Contrastive LearningQuestion Generation	CodeCode Available	5
Sample-Efficient Deep Reinforcement Learning via Episodic Backward Update	May 31, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Meta-Reinforcement Learning in Broad and Non-Parametric Environments	Aug 8, 2021	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	5
POCE: Primal Policy Optimization with Conservative Estimation for Multi-constraint Offline Reinforcement Learning	Jan 1, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	5
Unsupervised Learning for Robust Fitting:A Reinforcement Learning Approach	Mar 5, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Sample-Efficient Model-Free Reinforcement Learning with Off-Policy Critics	Mar 11, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Sample Efficient Model-free Reinforcement Learning from LTL Specifications with Optimality Guarantees	May 2, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Reinforcement Learning Based Graph-to-Sequence Model for Natural Question Generation	Aug 14, 2019	Graph Neural NetworkGraph-to-Sequence	CodeCode Available	5
Unsupervised Predictive Memory in a Goal-Directed Agent	Mar 28, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Sample Efficient Policy Gradient Methods with Recursive Variance Reduction	Sep 18, 2019	Policy Gradient Methodsreinforcement-learning	CodeCode Available	5
MCTS-GEB: Monte Carlo Tree Search is a Good E-graph Builder	Mar 8, 2023	graph constructionReinforcement Learning (RL)	CodeCode Available	5
Reinforcement Learning-based Heuristics to Guide Domain-Independent Dynamic Programming	Mar 20, 2025	Combinatorial Optimizationreinforcement-learning	CodeCode Available	5
Unsupervised Reinforcement Adaptation for Class-Imbalanced Text Classification	May 26, 2022	ClassificationDomain Adaptation	CodeCode Available	5
Unsupervised Reinforcement Learning in Multiple Environments	Dec 16, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 176 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified