Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11201–11225 of 15113 papers

Title	Date	Tasks	Status
A Look at Value-Based Decision-Time vs. Background Planning Methods Across Different Settings	Jun 16, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Understanding Deep Neural Function Approximation in Reinforcement Learning via ε-Greedy Exploration	Sep 15, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Understanding End-to-End Model-Based Reinforcement Learning Methods as Implicit Parameterization	Dec 1, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Understanding & Generalizing AlphaGo Zero	May 1, 2019	Decision Makingreinforcement-learning	—Unverified
Understanding Hindsight Goal Relabeling from a Divergence Minimization Perspective	Sep 26, 2022	Imitation LearningMulti-Goal Reinforcement Learning	—Unverified
The Importance of Online Data: Understanding Preference Fine-tuning via Coverage	Jun 3, 2024	Reinforcement Learning (RL)	—Unverified
Understanding Reinforcement Learning Algorithms: The Progress from Basic Q-learning to Proximal Policy Optimization	Mar 31, 2023	Offline RLQ-Learning	—Unverified
Understanding Self-Predictive Learning for Reinforcement Learning	Dec 6, 2022	reinforcement-learningReinforcement Learning	—Unverified
Understanding the Complexity Gains of Single-Task RL with a Curriculum	Dec 24, 2022	Reinforcement Learning (RL)	—Unverified
Understanding the Generalization Gap in Visual Reinforcement Learning	Sep 29, 2021	Data AugmentationDeep Reinforcement Learning	—Unverified
Understanding the Limits of Poisoning Attacks in Episodic Reinforcement Learning	Aug 29, 2022	reinforcement-learningReinforcement Learning	—Unverified
Understanding the Pathologies of Approximate Policy Evaluation when Combined with Greedification in Reinforcement Learning	Oct 28, 2020	Reinforcement Learning (RL)	—Unverified
Understanding the Relation Between Maximum-Entropy Inverse Reinforcement Learning and Behaviour Cloning	Mar 27, 2019	continuous-controlContinuous Control	—Unverified
Understanding the Synergies between Quality-Diversity and Deep Reinforcement Learning	Mar 10, 2023	Deep Reinforcement LearningDiversity	—Unverified
Understanding the World to Solve Social Dilemmas Using Multi-Agent Reinforcement Learning	May 19, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Understanding Value Decomposition Algorithms in Deep Cooperative Multi-Agent Reinforcement Learning	Feb 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Understanding What Affects the Generalization Gap in Visual Reinforcement Learning: Theory and Empirical Evidence	Feb 5, 2024	continuous-controlContinuous Control	—Unverified
Undirected Machine Translation with Discriminative Reinforcement Learning	Apr 1, 2014	Language ModellingMachine Translation	—Unverified
UneVEn: Universal Value Exploration for Multi-Agent Reinforcement Learning	Oct 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
UNEX-RL: Reinforcing Long-Term Rewards in Multi-Stage Recommender Systems with UNidirectional EXecution	Jan 12, 2024	Multi-agent Reinforcement LearningRecommendation Systems	—Unverified
Reinforcement Learning in Credit Scoring and Underwriting	Dec 15, 2022	Decision MakingEfficient Exploration	—Unverified
UniCon: Universal Neural Controller For Physics-based Character Motion	Nov 30, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Unified Algorithms for RL with Decision-Estimation Coefficients: PAC, Reward-Free, Preference-Based Learning, and Beyond	Sep 23, 2022	PAC learningReinforcement Learning (RL)	—Unverified
Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning	May 20, 2021	AttributeConversational Recommendation	—Unverified
Unified Emulation-Simulation Training Environment for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified

Show:10 25 50

← PrevPage 449 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified