Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7151–7175 of 15113 papers

Title	Date	Tasks	Status	Hype
Improving Generalization of Deep Reinforcement Learning-based TSP Solvers	Oct 6, 2021	Deep Reinforcement LearningGraph Neural Network	—Unverified	0
Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance	Oct 6, 2021	Multi-agent Reinforcement LearningPrivacy Preserving	—Unverified	0
Hierarchical Potential-based Reward Shaping from Task Specifications	Oct 6, 2021	Autonomous DrivingReinforcement Learning (RL)	CodeCode Available	0
Adaptive control of a mechatronic system using constrained residual reinforcement learning	Oct 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Solving the Heterogeneous Capacitated Vehicle Routing Problem	Oct 6, 2021	DecoderDeep Reinforcement Learning	CodeCode Available	1
Heterogeneous Attentions for Solving Pickup and Delivery Problem via Deep Reinforcement Learning	Oct 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Decentralized Cooperative Lane Changing at Freeway Weaving Areas Using Multi-Agent Deep Reinforcement Learning	Oct 5, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep reinforcement learning for guidewire navigation in coronary artery phantom	Oct 5, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
CARL: A Benchmark for Contextual and Adaptive Reinforcement Learning	Oct 5, 2021	Physical Simulationsreinforcement-learning	CodeCode Available	1
DeepEdge: A Deep Reinforcement Learning based Task Orchestrator for Edge Computing	Oct 5, 2021	Deep Reinforcement LearningEdge-computing	—Unverified	0
A Deep Reinforcement Learning Framework for Contention-Based Spectrum Sharing	Oct 5, 2021	Deep Reinforcement LearningFairness	—Unverified	0
A study of first-passage time minimization via Q-learning in heated gridworlds	Oct 5, 2021	Q-Learningreinforcement-learning	—Unverified	0
Dropout Q-Functions for Doubly Efficient Reinforcement Learning	Oct 5, 2021	Computational EfficiencyQ-Learning	CodeCode Available	1
OTTR: Off-Road Trajectory Tracking using Reinforcement Learning	Oct 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
NaRLE: Natural Language Models using Reinforcement Learning with Emotion Feedback	Oct 5, 2021	Deep Reinforcement Learningintent-classification	—Unverified	0
Mining for Potent Inhibitors through Artificial Intelligence and Physics: A Unified Methodology for Ligand Based and Structure Based Drug Design	Oct 5, 2021	Deep Reinforcement LearningDrug Design	—Unverified	0
You Only Evaluate Once: a Simple Baseline Algorithm for Offline RL	Oct 5, 2021	D4RLOffline RL	—Unverified	0
Multi-Agent Path Planning Using Deep Reinforcement Learning	Oct 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble	Oct 4, 2021	Adroid door-clonedAdroid door-human	CodeCode Available	1
Reinforcement Learning for Admission Control in Wireless Virtual Network Embedding	Oct 4, 2021	Deep Reinforcement LearningNetwork Embedding	—Unverified	0
Large Batch Experience Replay	Oct 4, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Behaviour-conditioned policies for cooperative reinforcement learning tasks	Oct 4, 2021	Deep Reinforcement LearningMeta-Learning	—Unverified	0
A Modified Q-Learning Algorithm for Rate-Profiling of Polarization Adjusted Convolutional (PAC) Codes	Oct 4, 2021	Q-Learningreinforcement-learning	—Unverified	0
Learning to Assist Agents by Observing Them	Oct 4, 2021	AI Agentreinforcement-learning	—Unverified	0
Hit and Lead Discovery with Explorative RL and Fragment-based Molecule Generation	Oct 4, 2021	Drug DesignMolecular Docking	—Unverified	0

Show:10 25 50

← PrevPage 287 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified