Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7151–7200 of 15113 papers

Title	Date	Tasks	Status	Hype
Improving Generalization of Deep Reinforcement Learning-based TSP Solvers	Oct 6, 2021	Deep Reinforcement LearningGraph Neural Network	—Unverified	0
Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance	Oct 6, 2021	Multi-agent Reinforcement LearningPrivacy Preserving	—Unverified	0
Hierarchical Potential-based Reward Shaping from Task Specifications	Oct 6, 2021	Autonomous DrivingReinforcement Learning (RL)	CodeCode Available	0
Adaptive control of a mechatronic system using constrained residual reinforcement learning	Oct 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Solving the Heterogeneous Capacitated Vehicle Routing Problem	Oct 6, 2021	DecoderDeep Reinforcement Learning	CodeCode Available	1
Heterogeneous Attentions for Solving Pickup and Delivery Problem via Deep Reinforcement Learning	Oct 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Decentralized Cooperative Lane Changing at Freeway Weaving Areas Using Multi-Agent Deep Reinforcement Learning	Oct 5, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep reinforcement learning for guidewire navigation in coronary artery phantom	Oct 5, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
CARL: A Benchmark for Contextual and Adaptive Reinforcement Learning	Oct 5, 2021	Physical Simulationsreinforcement-learning	CodeCode Available	1
DeepEdge: A Deep Reinforcement Learning based Task Orchestrator for Edge Computing	Oct 5, 2021	Deep Reinforcement LearningEdge-computing	—Unverified	0
A Deep Reinforcement Learning Framework for Contention-Based Spectrum Sharing	Oct 5, 2021	Deep Reinforcement LearningFairness	—Unverified	0
A study of first-passage time minimization via Q-learning in heated gridworlds	Oct 5, 2021	Q-Learningreinforcement-learning	—Unverified	0
Dropout Q-Functions for Doubly Efficient Reinforcement Learning	Oct 5, 2021	Computational EfficiencyQ-Learning	CodeCode Available	1
OTTR: Off-Road Trajectory Tracking using Reinforcement Learning	Oct 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
NaRLE: Natural Language Models using Reinforcement Learning with Emotion Feedback	Oct 5, 2021	Deep Reinforcement Learningintent-classification	—Unverified	0
Mining for Potent Inhibitors through Artificial Intelligence and Physics: A Unified Methodology for Ligand Based and Structure Based Drug Design	Oct 5, 2021	Deep Reinforcement LearningDrug Design	—Unverified	0
You Only Evaluate Once: a Simple Baseline Algorithm for Offline RL	Oct 5, 2021	D4RLOffline RL	—Unverified	0
Multi-Agent Path Planning Using Deep Reinforcement Learning	Oct 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble	Oct 4, 2021	Adroid door-clonedAdroid door-human	CodeCode Available	1
Reinforcement Learning for Admission Control in Wireless Virtual Network Embedding	Oct 4, 2021	Deep Reinforcement LearningNetwork Embedding	—Unverified	0
Large Batch Experience Replay	Oct 4, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Behaviour-conditioned policies for cooperative reinforcement learning tasks	Oct 4, 2021	Deep Reinforcement LearningMeta-Learning	—Unverified	0
A Modified Q-Learning Algorithm for Rate-Profiling of Polarization Adjusted Convolutional (PAC) Codes	Oct 4, 2021	Q-Learningreinforcement-learning	—Unverified	0
Learning to Assist Agents by Observing Them	Oct 4, 2021	AI Agentreinforcement-learning	—Unverified	0
Hit and Lead Discovery with Explorative RL and Fragment-based Molecule Generation	Oct 4, 2021	Drug DesignMolecular Docking	—Unverified	0
Collective eXplainable AI: Explaining Cooperative Strategies and Agent Contribution in Multiagent Reinforcement Learning with Shapley Values	Oct 4, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Automating Privilege Escalation with Deep Reinforcement Learning	Oct 4, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
DRL-Clusters: Buffer Management with Clustering based Deep Reinforcement Learning	Oct 3, 2021	ClusteringDeep Reinforcement Learning	—Unverified	0
Meta-Reinforcement Learning via Buffering Graph Signatures for Live Video Streaming Events	Oct 3, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available	0
Decentralized Safe Reinforcement Learning for Voltage Control	Oct 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Novel Automated Curriculum Strategy to Solve Hard Sokoban Planning Instances	Oct 3, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Parallel Actors and Learners: A Framework for Generating Scalable RL Implementations	Oct 3, 2021	CPUGPU	—Unverified	0
Mapping Language to Programs using Multiple Reward Components with Inverse Reinforcement Learning	Oct 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Seeking Visual Discomfort: Curiosity-driven Representations for Reinforcement Learning	Oct 2, 2021	Diversityreinforcement-learning	—Unverified	0
Feel-Good Thompson Sampling for Contextual Bandits and Reinforcement Learning	Oct 2, 2021	Multi-Armed Banditsregression	—Unverified	0
BRAC+: Improved Behavior Regularized Actor Critic for Offline Reinforcement Learning	Oct 2, 2021	Offline RLreinforcement-learning	CodeCode Available	0
Terminal Adaptive Guidance for Autonomous Hypersonic Strike Weapons via Reinforcement Learning	Oct 1, 2021	Meta-Learningreinforcement-learning	—Unverified	0
Offline Reinforcement Learning with Reverse Model-based Imagination	Oct 1, 2021	Data Augmentationmodel	CodeCode Available	1
Safety aware model-based reinforcement learning for optimal control of a class of output-feedback nonlinear systems	Oct 1, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Motion Planning for Autonomous Vehicles in the Presence of Uncertainty Using Reinforcement Learning	Oct 1, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Multi-lane Cruising Using Hierarchical Planning and Reinforcement Learning	Oct 1, 2021	Hierarchical Reinforcement LearningMotion Planning	—Unverified	0
A Cramér Distance perspective on Quantile Regression based Distributional Reinforcement Learning	Oct 1, 2021	Distributional Reinforcement Learningquantile regression	CodeCode Available	0
Cellular traffic offloading via Opportunistic Networking with Reinforcement Learning	Oct 1, 2021	Q-Learningreinforcement-learning	—Unverified	0
Guiding Evolutionary Strategies by Differentiable Robot Simulators	Oct 1, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
DNN-Opt: An RL Inspired Optimization for Analog Circuit Sizing using Deep Neural Networks	Oct 1, 2021	Reinforcement Learning (RL)	—Unverified	0
Divergence-Regularized Multi-Agent Actor-Critic	Oct 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Decentralized Graph-Based Multi-Agent Reinforcement Learning Using Reward Machines	Sep 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Network Verification in Control	Sep 30, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
MOLUCINATE: A Generative Model for Molecules in 3D Space	Sep 30, 2021	Positionreinforcement-learning	CodeCode Available	1
Trajectory Planning with Deep Reinforcement Learning in High-Level Action Spaces	Sep 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 144 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified