Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2876–2900 of 15113 papers

Title	Date	Tasks	Status	Score
A general class of surrogate functions for stable and efficient reinforcement learning	Aug 12, 2021	MuJoCoPolicy Gradient Methods	CodeCode Available	5
A Self-Adaptive Proposal Model for Temporal Action Detection based on Reinforcement Learning	Jun 22, 2017	Action DetectionPosition	CodeCode Available	5
Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning	Mar 25, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improving Optimization Bounds using Machine Learning: Decision Diagrams meet Deep Reinforcement Learning	Sep 10, 2018	BIG-bench Machine LearningCombinatorial Optimization	CodeCode Available	5
Improving Generalization in Reinforcement Learning Training Regimes for Social Robot Navigation	Aug 29, 2023	Decision MakingNavigate	CodeCode Available	5
Improving Exploration in Soft-Actor-Critic with Normalizing Flows Policies	Jun 6, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
A Scavenger Hunt for Service Robots	Mar 9, 2021	Reinforcement Learning (RL)	CodeCode Available	5
Improving Experience Replay through Modeling of Similar Transitions' Sets	Nov 12, 2021	Atari Gamesreinforcement-learning	CodeCode Available	5
Improving Environment Robustness of Deep Reinforcement Learning Approaches for Autonomous Racing Using Bayesian Optimization-based Curriculum Learning	Dec 16, 2023	Autonomous DrivingAutonomous Racing	CodeCode Available	5
Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents	Dec 18, 2017	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	5
Improving Coordination in Small-Scale Multi-Agent Deep Reinforcement Learning through Memory-driven Communication	Jan 12, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
Improving Deep Reinforcement Learning by Reducing the Chain Effect of Value and Policy Churn	Sep 7, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Contrasting Exploration in Parameter and Action Space: A Zeroth-Order Optimization Perspective	Jan 31, 2019	continuous-controlContinuous Control	CodeCode Available	5
Improving Automatic Source Code Summarization via Deep Reinforcement Learning	Nov 17, 2018	Code SummarizationDecoder	CodeCode Available	5
Continuous Value Iteration (CVI) Reinforcement Learning and Imaginary Experience Replay (IER) for learning multi-goal, continuous action and state space controllers	Aug 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improving Dialogue Management: Quality Datasets vs Models	Oct 2, 2023	Dialog LearningDialogue Management	CodeCode Available	5
Improving Generalization on the ProcGen Benchmark with Simple Architectural Changes and Scale	Oct 13, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Continuous Transition: Improving Sample Efficiency for Continuous Control Problems via MixUp	Nov 30, 2020	continuous-controlContinuous Control	CodeCode Available	5
A framework for reinforcement learning with autocorrelated actions	Sep 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improved Off-policy Reinforcement Learning in Biological Sequence Design	Oct 6, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning	Jan 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Continuous-Time Mean-Variance Portfolio Selection: A Reinforcement Learning Framework	Apr 25, 2019	Continuous ControlPortfolio Optimization	CodeCode Available	5
Implicit Quantile Networks for Distributional Reinforcement Learning	Jun 14, 2018	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Contrastive Behavioral Similarity Embeddings for Generalization in Reinforcement Learning	Jan 13, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Importance Prioritized Policy Distillation	Aug 25, 2022	Atari GamesDecision Making	CodeCode Available	5

Show:10 25 50

← PrevPage 116 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified