Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6601–6625 of 15113 papers

Title	Date	Tasks	Status
Do Artificial Reinforcement-Learning Agents Matter Morally?	Oct 30, 2014	reinforcement-learningReinforcement Learning	—Unverified
Do as I can, not as I get	Jun 17, 2023	Knowledge GraphsMulti-modal Knowledge Graph	—Unverified
Do Autonomous Agents Benefit from Hearing?	May 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
DOB-Net: Actively Rejecting Unknown Excessive Time-Varying Disturbances	Jul 10, 2019	PositionReinforcement Learning	—Unverified
Document-editing Assistants and Model-based Reinforcement Learning as a Path to Conversational AI	Aug 27, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Do Deep Reinforcement Learning Algorithms really Learn to Navigate?	Jan 1, 2018	Deep Reinforcement LearningNavigate	—Unverified
Does Explicit Prediction Matter in Deep Reinforcement Learning-Based Energy Management?	Aug 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
How Does an Approximate Model Help in Reinforcement Learning?	Dec 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Does Sparsity Help in Learning Misspecified Linear Bandits?	Mar 29, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Domain Adaptation for Deep Reinforcement Learning in Visually Distinct Games	Jan 1, 2018	Deep Reinforcement LearningDomain Adaptation	—Unverified
Domain Adaptation for Offline Reinforcement Learning with Limited Samples	Aug 22, 2024	Domain AdaptationOffline RL	—Unverified
Domain Adaptation for Reinforcement Learning on the Atari	Dec 18, 2018	continuous-controlContinuous Control	—Unverified
Domain Adaptation of Reinforcement Learning Agents based on Network Service Proximity	Mar 2, 2023	Domain AdaptationManagement	—Unverified
DOMAIN ADAPTATION VIA DISTRIBUTION AND REPRESENTATION MATCHING: A CASE STUDY ON TRAINING DATA SELECTION VIA REINFORCEMENT LEARNING	Sep 27, 2018	Dependency ParsingDomain Adaptation	—Unverified
Domain Adapting Deep Reinforcement Learning for Real-world Speech Emotion Recognition	Jul 7, 2022	Cross-corpusDeep Reinforcement Learning	—Unverified
Domain Adaptive Fake News Detection via Reinforcement Learning	Feb 16, 2022	Fake News Detectionreinforcement-learning	—Unverified
Domain Adversarial Reinforcement Learning	Feb 14, 2021	reinforcement-learningReinforcement Learning	—Unverified
Domain Adversarial Reinforcement Learning for Partial Domain Adaptation	May 10, 2019	Domain AdaptationPartial Domain Adaptation	—Unverified
Domain Generalization for Robust Model-Based Offline Reinforcement Learning	Nov 27, 2022	Domain GeneralizationOffline RL	—Unverified
Domain-Independent Optimistic Initialization for Reinforcement Learning	Oct 16, 2014	reinforcement-learningReinforcement Learning	—Unverified
Domain Knowledge-Based Automated Analog Circuit Design with Deep Reinforcement Learning	Feb 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Domain Knowledge Integration By Gradient Matching For Sample-Efficient Reinforcement Learning	May 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
DOMAIN: MilDly COnservative Model-BAsed OfflINe Reinforcement Learning	Sep 16, 2023	D4RLmodel	—Unverified
Domain Randomization for Robust, Affordable and Effective Closed-loop Control of Soft Robots	Mar 7, 2023	reinforcement-learningReinforcement Learning	—Unverified
Domain Randomization via Entropy Maximization	Nov 3, 2023	DiversityReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 265 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified