Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11301–11350 of 15113 papers

Title	Date	Tasks	Status
Using Cognitive Models to Train Warm Start Reinforcement Learning Agents for Human-Computer Interactions	Mar 10, 2021	Positionreinforcement-learning	—Unverified
Using Contrastive Samples for Identifying and Leveraging Possible Causal Relationships in Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
Using Cyber Terrain in Reinforcement Learning for Penetration Testing	Aug 16, 2021	reinforcement-learningReinforcement Learning	—Unverified
Using Deep Reinforcement Learning for the Continuous Control of Robotic Arms	Oct 15, 2018	continuous-controlContinuous Control	—Unverified
Using Deep Reinforcement Learning for Zero Defect Smart Forging	Jan 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using Deep Reinforcement Learning to Enhance Channel Sampling Patterns in Integrated Sensing and Communication	Dec 4, 2024	Deep Reinforcement LearningIntegrated sensing and communication	—Unverified
Using Deep Reinforcement Learning to Generate Rationales for Molecules	Jan 1, 2018	Deep Reinforcement LearningDrug Design	—Unverified
Using deep reinforcement learning to promote sustainable human behaviour on a common pool resource problem	Apr 23, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using Deep Reinforcement Learning to solve Optimal Power Flow problem with generator failures	May 4, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using Enhanced Gaussian Cross-Entropy in Imitation Learning to Digging the First Diamond in Minecraft	Dec 14, 2020	Imitation LearningMinecraft	—Unverified
Using Experience Classification for Training Non-Markovian Tasks	Oct 18, 2023	Autonomous DrivingClassification	—Unverified
Using General Value Functions to Learn Domain-Backed Inventory Management Policies	Nov 3, 2023	Decision MakingManagement	—Unverified
Using Graph-Aware Reinforcement Learning to Identify Winning Strategies in Diplomacy Games (Student Abstract)	Dec 31, 2021	reinforcement-learningReinforcement Learning	—Unverified
Using Implicit Behavior Cloning and Dynamic Movement Primitive to Facilitate Reinforcement Learning for Robot Motion Planning	Jul 29, 2023	Motion PlanningReinforcement Learning (RL)	—Unverified
Using Logical Specifications of Objectives in Multi-Objective Reinforcement Learning	Oct 3, 2019	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Using Memory-Based Learning to Solve Tasks with State-Action Constraints	Mar 8, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using Meta Reinforcement Learning to Bridge the Gap between Simulation and Experiment in Energy Demand Response	Apr 29, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Using Monte Carlo Tree Search as a Demonstrator within Asynchronous Deep RL	Nov 30, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using Part-based Representations for Explainable Deep Reinforcement Learning	Aug 21, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using Petri Nets as an Integrated Constraint Mechanism for Reinforcement Learning Tasks	Jul 5, 2024	Autonomous VehiclesReinforcement Learning (RL)	—Unverified
Using Reinforcement Learning for Demand Response of Domestic Hot Water Buffers: a Real-Life Demonstration	Mar 16, 2017	Decision MakingModel-based Reinforcement Learning	—Unverified
Using Reinforcement Learning to Allocate and Manage Service Function Chains in Cellular Networks	Jun 12, 2020	Managementreinforcement-learning	—Unverified
Using reinforcement learning to design an AI assistantfor a satisfying co-op experience	May 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Using Reinforcement Learning to Herd a Robotic Swarm to a Target Distribution	Jun 29, 2020	Q-Learningreinforcement-learning	—Unverified
Using Reinforcement Learning to Model Incrementality in a Fast-Paced Dialogue Game	Aug 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Using Reinforcement Learning to Simplify Mealtime Insulin Dosing for People with Type 1 Diabetes: In-Silico Experiments	Sep 17, 2023	Reinforcement Learning (RL)	—Unverified
Using Reinforcement Learning to Validate Empirical Game-Theoretic Analysis: A Continuous Double Auction Study	Apr 22, 2016	reinforcement-learningReinforcement Learning	—Unverified
Using Semantic Similarity as Reward for Reinforcement Learning in Sentence Generation	Jul 1, 2019	NMTreinforcement-learning	—Unverified
Learning When Not to Answer: A Ternary Reward Structure for Reinforcement Learning based Question Answering	Feb 26, 2019	Knowledge GraphsQuestion Answering	—Unverified
Continual Learning Using World Models for Pseudo-Rehearsal	Mar 6, 2019	Atari GamesContinual Learning	—Unverified
Optimistic Agent: Accurate Graph-Based Value Estimation for More Successful Visual Navigation	Apr 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Utility-Based Reinforcement Learning: Unifying Single-objective and Multi-objective Reinforcement Learning	Feb 5, 2024	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Utilization of Deep Reinforcement Learning for saccadic-based object visual search	Oct 20, 2016	Deep Reinforcement Learningreinforcement-learning	—Unverified
Utilizing Maximum Mean Discrepancy Barycenter for Propagating the Uncertainty of Value Functions in Reinforcement Learning	Mar 31, 2024	Atari GamesQ-Learning	—Unverified
Utilizing Prior Solutions for Reward Shaping and Composition in Entropy-Regularized Reinforcement Learning	Dec 2, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified
Dynamic Queue-Jump Lane for Emergency Vehicles under Partially Connected Settings: A Multi-Agent Deep Reinforcement Learning Approach	Mar 2, 2020	BlockingDeep Reinforcement Learning	—Unverified
V2N Service Scaling with Deep Reinforcement Learning	Jan 30, 2023	Deep Reinforcement LearningEdge-computing	—Unverified
VacciNet: Towards a Smart Framework for Learning the Distribution Chain Optimization of Vaccines for a Pandemic	Aug 1, 2022	Reinforcement Learning (RL)	—Unverified
Vairiational Stochastic Games	Mar 8, 2025	Reinforcement Learning (RL)Variational Inference	—Unverified
Validation of massively-parallel adaptive testing using dynamic control matching	May 2, 2023	MarketingReinforcement Learning (RL)	—Unverified
Value-Added Chemical Discovery Using Reinforcement Learning	Nov 10, 2019	Computational chemistryDeep Reinforcement Learning	—Unverified
Adaptive Q-Aid for Conditional Supervised Learning in Offline Reinforcement Learning	Feb 3, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Value-aware Recommendation based on Reinforced Profit Maximization in E-commerce Systems	Feb 3, 2019	Recommendation Systemsreinforcement-learning	—Unverified
Bayesian Meta-reinforcement Learning for Traffic Signal Control	Oct 1, 2020	Continual LearningMeta-Learning	—Unverified
Value-Based Reinforcement Learning for Continuous Control Robotic Manipulation in Multi-Task Sparse Reward Settings	Jul 28, 2021	continuous-controlContinuous Control	—Unverified
Value-Consistent Representation Learning for Data-Efficient Reinforcement Learning	Jun 25, 2022	Contrastive LearningData Augmentation	—Unverified
Value-driven Hindsight Modelling	Feb 19, 2020	Atari GamesReinforcement Learning	—Unverified
Value Driven Representation for Human-in-the-Loop Reinforcement Learning	Apr 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Value Enhancement of Reinforcement Learning via Efficient and Robust Trust Region Optimization	Jan 5, 2023	Decision Makingreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 227 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified