Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4651–4675 of 15113 papers

Title	Date	Tasks	Status
An End-to-End Deep RL Framework for Task Arrangement in Crowdsourcing Platforms	Nov 4, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
An Energy-Saving Snake Locomotion Gait Policy Obtained Using Deep Reinforcement Learning	Mar 8, 2021	Deep Reinforcement LearningNavigate	—Unverified
An Enhanced-State Reinforcement Learning Algorithm for Multi-Task Fusion in Large-Scale Recommender Systems	Sep 18, 2024	Multi-Task LearningRecommendation Systems	—Unverified
An Entropy Regularization Free Mechanism for Policy-based Reinforcement Learning	Jun 1, 2021	Atari GamesDiversity	—Unverified
A Nesterov's Accelerated quasi-Newton method for Global Routing using Deep Reinforcement Learning	Oct 15, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
A Neuromorphic Architecture for Reinforcement Learning from Real-Valued Observations	Jul 6, 2023	AcrobotDecision Making	—Unverified
An Evolutionary Framework for Connect-4 as Test-Bed for Comparison of Advanced Minimax, Q-Learning and MCTS	May 26, 2024	Decision MakingQ-Learning	—Unverified
A New Approach for Resource Scheduling with Deep Reinforcement Learning	Jun 21, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
A New Concept of Deep Reinforcement Learning based Augmented General Sequence Tagging System	Dec 26, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
A New Concept of Deep Reinforcement Learning based Augmented General Tagging System	Aug 1, 2018	Deep Reinforcement LearningNamed Entity Recognition (NER)	—Unverified
A new convergent variant of Q-learning with linear function approximation	Dec 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
A New Deep Neural Architecture Search Pipeline for Face Recognition	May 12, 2020	AutoMLFace Recognition	—Unverified
A new dog learns old tricks: RL finds classic optimization algorithms	May 1, 2019	Combinatorial Optimizationreinforcement-learning	—Unverified
A New Framework for Query Efficient Active Imitation Learning	Dec 30, 2019	Imitation LearningReinforcement Learning	—Unverified
A New Interpretation of the Certainty-Equivalence Approach for PAC Reinforcement Learning with a Generative Model	Jan 5, 2025	Reinforcement Learning (RL)	—Unverified
A New Policy Iteration Algorithm For Reinforcement Learning in Zero-Sum Markov Games	Mar 17, 2023	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
A new Potential-Based Reward Shaping for Reinforcement Learning Agent	Feb 17, 2019	Atari Gamesreinforcement-learning	—Unverified
A new Reinforcement Learning framework to discover natural flavor molecules	Sep 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
A New Representation of Successor Features for Transfer across Dissimilar Environments	Jul 18, 2021	Gaussian ProcessesReinforcement Learning (RL)	—Unverified
A new soft computing method for integration of expert's knowledge in reinforcement learn-ing problems	Jun 13, 2021	reinforcement-learningReinforcement Learning	—Unverified
A New Tensioning Method using Deep Reinforcement Learning for Surgical Pattern Cutting	Jan 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
An Examination of Preference-based Reinforcement Learning for Treatment Recommendation	Jan 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
An Experimental Comparison Between Temporal Difference and Residual Gradient with Neural Network Approximation	May 25, 2022	Q-Learningreinforcement-learning	—Unverified
An Experimental Design Perspective on Exploration in Reinforcement Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
An Exponential Lower Bound for Linearly-Realizable MDPs with Constant Suboptimality Gap	Mar 23, 2021	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 187 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified