Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6401–6450 of 15113 papers

Title	Date	Tasks	Status
DL-DRL: A double-level deep reinforcement learning approach for large-scale task scheduling of multi-UAV	Aug 4, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Backward Imitation and Forward Reinforcement Learning via Bi-directional Model Rollouts	Aug 4, 2022	Generative Adversarial NetworkModel-based Reinforcement Learning	—Unverified
Human Decision Makings on Curriculum Reinforcement Learning with Difficulty Adjustment	Aug 4, 2022	reinforcement-learningReinforcement Learning	—Unverified
Towards Augmented Microscopy with Reinforcement Learning-Enhanced Workflows	Aug 4, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Transferable Multi-Agent Reinforcement Learning with Dynamic Participating Agents	Aug 4, 2022	Few-Shot LearningMulti-agent Reinforcement Learning	—Unverified
Supervised and Reinforcement Learning from Observations in Reconnaissance Blind Chess	Aug 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Joint V2I Network Selection and Autonomous Driving Policies	Aug 3, 2022	Autonomous DrivingAutonomous Vehicles	—Unverified
AACC: Asymmetric Actor-Critic in Contextual Reinforcement Learning	Aug 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
Deep VULMAN: A Deep Reinforcement Learning-Enabled Cyber Vulnerability Management Framework	Aug 3, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
A Lightweight Transmission Parameter Selection Scheme Using Reinforcement Learning for LoRaWAN	Aug 3, 2022	Fairnessreinforcement-learning	—Unverified
Joint Sensing and Communications for Deep Reinforcement Learning-based Beam Management in 6G	Aug 3, 2022	ClusteringDeep Reinforcement Learning	—Unverified
Chemotaxis of sea urchin sperm cells through deep reinforcement learning	Aug 2, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Digital Twin-Assisted Efficient Reinforcement Learning for Edge Task Scheduling	Aug 2, 2022	Q-Learningreinforcement-learning	—Unverified
Smart caching in a Data Lake for High Energy Physics analysis	Aug 2, 2022	Managementreinforcement-learning	—Unverified
Mitigating Off-Policy Bias in Actor-Critic Methods with One-Step Q-learning: A Novel Correction Approach	Aug 1, 2022	continuous-controlContinuous Control	CodeCode Available
VacciNet: Towards a Smart Framework for Learning the Distribution Chain Optimization of Vaccines for a Pandemic	Aug 1, 2022	Reinforcement Learning (RL)	—Unverified
Retrieval of surgical phase transitions using reinforcement learning	Aug 1, 2022	Multi-class Classificationreinforcement-learning	—Unverified
Hierarchical Reinforcement Learning for Precise Soccer Shooting Skills using a Quadrupedal Robot	Aug 1, 2022	Deep Reinforcement LearningFriction	—Unverified
Learning to Grasp on the Moon from 3D Octree Observations with Deep Reinforcement Learning	Aug 1, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Maintenance Planning Framework using Online and Offline Deep Reinforcement Learning	Aug 1, 2022	Asset ManagementDeep Reinforcement Learning	—Unverified
Learning to generate Reliable Broadcast Algorithms	Jul 31, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Robot Policy Learning from Demonstration Using Advantage Weighting and Early Termination	Jul 31, 2022	Imitation Learningreinforcement-learning	—Unverified
Using Chatbots to Teach Languages	Jul 31, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Solving the vehicle routing problem with deep reinforcement learning	Jul 30, 2022	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Reinforcement learning with experience replay and adaptation of action dispersion	Jul 30, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Bayesian Approach to Learning Bandit Structure in Markov Decision Processes	Jul 30, 2022	Decision Makingreinforcement-learning	—Unverified
Deep Reinforcement Learning for System-on-Chip: Myths and Realities	Jul 29, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Cyclic Policy Distillation: Sample-Efficient Sim-to-Real Reinforcement Learning with Domain Randomization	Jul 29, 2022	Deep Reinforcement LearningMuJoCo	CodeCode Available
Combining Evolutionary Search with Behaviour Cloning for Procedurally Generated Content	Jul 29, 2022	Reinforcement Learning (RL)valid	—Unverified
Meta Reinforcement Learning with Successor Feature Based Context	Jul 29, 2022	continuous-controlContinuous Control	—Unverified
Sample-efficient Safe Learning for Online Nonlinear Control with Control Barrier Functions	Jul 29, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Sampling Attacks on Meta Reinforcement Learning: A Minimax Formulation and Complexity Analysis	Jul 29, 2022	Meta-LearningMeta Reinforcement Learning	CodeCode Available
Raising Student Completion Rates with Adaptive Curriculum and Contextual Bandits	Jul 28, 2022	Model-based Reinforcement LearningMulti-Armed Bandits	—Unverified
Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning	Jul 28, 2022	Q-Learningreinforcement-learning	—Unverified
RangL: A Reinforcement Learning Competition Platform	Jul 28, 2022	OpenAI Gymreinforcement-learning	—Unverified
Latent Properties of Lifelong Learning Systems	Jul 28, 2022	Lifelong learningreinforcement-learning	—Unverified
Graph Inverse Reinforcement Learning from Diverse Videos	Jul 28, 2022	Diversityreinforcement-learning	—Unverified
Dynamic Shielding for Reinforcement Learning in Black-Box Environments	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control	Jul 27, 2022	continuous-controlContinuous Control	—Unverified
A Contact-Safe Reinforcement Learning Framework for Contact-Rich Robot Manipulation	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
POSET-RL: Phase ordering for Optimizing Size and Execution Time using Reinforcement Learning	Jul 27, 2022	CPUreinforcement-learning	—Unverified
Structural Similarity for Improved Transfer in Reinforcement Learning	Jul 27, 2022	Q-Learningreinforcement-learning	—Unverified
Multi-Objective Provisioning of Network Slices using Deep Reinforcement Learning	Jul 27, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Safe and Robust Experience Sharing for Deterministic Policy Gradient Algorithms	Jul 27, 2022	continuous-controlContinuous Control	CodeCode Available
Unsupervised Training for Neural TSP Solver	Jul 27, 2022	Graph Neural Networkreinforcement-learning	—Unverified
Semi-analytical Industrial Cooling System Model for Reinforcement Learning	Jul 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
Offline Reinforcement Learning at Multiple Frequencies	Jul 26, 2022	Offline RLreinforcement-learning	—Unverified
Planning and Learning: Path-Planning for Autonomous Vehicles, a Review of the Literature	Jul 26, 2022	Autonomous Vehiclesreinforcement-learning	—Unverified
Branch Ranking for Efficient Mixed-Integer Programming via Offline Ranking-based Policy Learning	Jul 26, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Live in the Moment: Learning Dynamics Model Adapted to Evolving Policy	Jul 25, 2022	continuous-controlContinuous Control	CodeCode Available

Show:10 25 50

← PrevPage 129 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified