Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5951–5975 of 15113 papers

Title	Date	Tasks	Status
Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Making by Reinforcement Learning	May 21, 2021	Decision MakingReinforcement Learning (RL)	—Unverified
Learning in Mean Field Games: A Survey	May 25, 2022	Reinforcement Learning (RL)Survey	—Unverified
Learning medical triage from clinicians using Deep Q-Learning	Mar 28, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Memory-Dependent Continuous Control from Demonstrations	Feb 18, 2021	continuous-controlContinuous Control	—Unverified
Data-Driven Merton's Strategies via Policy Randomization	Dec 19, 2023	Reinforcement Learning (RL)	—Unverified
Learning Meta Representations for Agents in Multi-Agent Reinforcement Learning	Aug 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Learning Mobile Robot Navigation in the Dense Crowd with Deep Reinforcement Learning	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer	Sep 22, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Decision Making in Monopoly using a Hybrid Deep Reinforcement Learning Approach	Mar 1, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Montezuma's Revenge from a Single Demonstration	Dec 8, 2018	Montezuma's Revengereinforcement-learning	—Unverified
Learning Multi-Agent Intention-Aware Communication for Optimal Multi-Order Execution in Finance	Jul 6, 2023	Reinforcement Learning (RL)	—Unverified
Learning Multi-Task Transferable Rewards via Variational Inverse Reinforcement Learning	Jun 19, 2022	Generative Adversarial NetworkImitation Learning	—Unverified
Learning Natural Language Generation from Scratch	Sep 20, 2021	Language ModelingLanguage Modelling	—Unverified
Learning Navigation Behaviors End-to-End with AutoRL	Sep 26, 2018	Deep Reinforcement LearningMotion Planning	—Unverified
Learning Near Optimal Policies with Low Inherent Bellman Error	Feb 29, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Not to Spoof	Jun 9, 2023	Reinforcement Learning (RL)	—Unverified
Learning objects from pixels	Jan 1, 2018	Atari GamesObject	—Unverified
Learning offline: memory replay in biological and artificial reinforcement learning	Sep 21, 2021	Continual LearningDecision Making	—Unverified
Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration	Mar 31, 2024	continuous-controlContinuous Control	—Unverified
Learning on Abstract Domains: A New Approach for Verifiable Guarantee in Reinforcement Learning	Jun 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Online Policies for Person Tracking in Multi-View Environments	Dec 26, 2023	Human DetectionReinforcement Learning (RL)	—Unverified
Learning on the Job: Long-Term Behavioural Adaptation in Human-Robot Interactions	Mar 20, 2022	Reinforcement Learning (RL)	—Unverified
Learning Open Domain Multi-hop Search Using Reinforcement Learning	May 30, 2022	Information RetrievalReading Comprehension	—Unverified
Learning Optimal Deterministic Policies with Stochastic Policy Gradients	May 3, 2024	Reinforcement Learning (RL)	—Unverified
Learning Optimal Strategies for Temporal Tasks in Stochastic Games	Feb 8, 2021	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 239 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified