Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6501–6550 of 15113 papers

Title	Date	Tasks	Status	Hype
Leveraging Queue Length and Attention Mechanisms for Enhanced Traffic Signal Control Optimization	Dec 30, 2021	Reinforcement Learning (RL)Traffic Signal Control	CodeCode Available	1
Constraint Sampling Reinforcement Learning: Incorporating Expertise For Faster Learning	Dec 30, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
MORAL: Aligning AI with Human Norms through Multi-Objective Reinforced Active Learning	Dec 30, 2021	Active LearningEthics	CodeCode Available	0
Sequential memory improves sample and memory efficiency in Episodic Control	Dec 29, 2021	Deep Reinforcement LearningHippocampus	CodeCode Available	0
Control Theoretic Analysis of Temporal Difference Learning	Dec 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Modified DDPG car-following model with a real-world human driving experience with CARLA simulator	Dec 29, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Embodied Learning for Lifelong Visual Perception	Dec 28, 2021	Active LearningDeep Reinforcement Learning	—Unverified	0
Efficient Performance Bounds for Primal-Dual Reinforcement Learning from Demonstrations	Dec 28, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Exponential Family Model-Based Reinforcement Learning via Score Matching	Dec 28, 2021	Density EstimationModel-based Reinforcement Learning	CodeCode Available	0
Robustness and risk management via distributional dynamic programming	Dec 28, 2021	Distributional Reinforcement LearningManagement	—Unverified	0
The Statistical Complexity of Interactive Decision Making	Dec 27, 2021	Decision Makingreinforcement-learning	—Unverified	0
Safe Reinforcement Learning with Chance-constrained Model Predictive Control	Dec 27, 2021	Model Predictive Controlreinforcement-learning	—Unverified	0
RELDEC: Reinforcement Learning-Based Decoding of Moderate Length LDPC Codes	Dec 27, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Multiagent Model-based Credit Assignment for Continuous Control	Dec 27, 2021	continuous-controlContinuous Control	—Unverified	0
A Graph Attention Learning Approach to Antenna Tilt Optimization	Dec 27, 2021	Graph AttentionQ-Learning	—Unverified	0
Intelligent Traffic Light via Policy-based Deep Reinforcement Learning	Dec 27, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Improving the Performance of Backward Chained Behavior Trees that use Reinforcement Learning	Dec 27, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Can Reinforcement Learning Find Stackelberg-Nash Equilibria in General-Sum Markov Games with Myopic Followers?	Dec 27, 2021	Reinforcement Learning (RL)	—Unverified	0
Abstractions of General Reinforcement Learning	Dec 26, 2021	General Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning with Dynamic Convex Risk Measures	Dec 26, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Neuro-Symbolic Hierarchical Rule Induction	Dec 26, 2021	Inductive logic programmingreinforcement-learning	—Unverified	0
Reducing Planning Complexity of General Reinforcement Learning with Non-Markovian Abstractions	Dec 26, 2021	Decision MakingGeneral Reinforcement Learning	—Unverified	0
Dynamic Channel Access via Meta-Reinforcement Learning	Dec 24, 2021	channel selectionDeep Reinforcement Learning	—Unverified	0
A Survey on Interpretable Reinforcement Learning	Dec 24, 2021	Autonomous DrivingDecision Making	—Unverified	0
Lane Change Decision-Making through Deep Reinforcement Learning	Dec 24, 2021	Autonomous DrivingDecision Making	CodeCode Available	1
An Efficient Combinatorial Optimization Model Using Learning-to-Rank Distillation	Dec 24, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	0
Rediscovering Affordance: A Reinforcement Learning Perspective	Dec 24, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
On the Unreasonable Efficiency of State Space Clustering in Personalization Tasks	Dec 24, 2021	Clusteringreinforcement-learning	CodeCode Available	0
Learning to Walk with Dual Agents for Knowledge Graph Reasoning	Dec 23, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Improving the Efficiency of Off-Policy Reinforcement Learning by Accounting for Past Decisions	Dec 23, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Missing Velocity in Dynamic Obstacle Avoidance based on Deep Reinforcement Learning	Dec 23, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Safety and Liveness Guarantees through Reach-Avoid Reinforcement Learning	Dec 23, 2021	Deep Reinforcement LearningQ-Learning	CodeCode Available	1
Local Advantage Networks for Cooperative Multi-Agent Reinforcement Learning	Dec 23, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Alpha-Mini: Minichess Agent with Deep Reinforcement Learning	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Adversarial Deep Reinforcement Learning for Improving the Robustness of Multi-agent Autonomous Driving Policies	Dec 22, 2021	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	1
A Deep Reinforcement Learning Approach for Solving the Traveling Salesman Problem with Drone	Dec 22, 2021	Combinatorial OptimizationComputational Efficiency	CodeCode Available	1
Deep Reinforcement Learning for Optimal Power Flow with Renewables Using Graph Information	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Graph augmented Deep Reinforcement Learning in the GameRLand3D environment	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Evaluating the Robustness of Deep Reinforcement Learning for Autonomous Policies in a Multi-agent Urban Driving Environment	Dec 22, 2021	Autonomous DrivingBenchmarking	CodeCode Available	0
Direct Behavior Specification via Constrained Reinforcement Learning	Dec 22, 2021	continuous-controlContinuous Control	CodeCode Available	1
Maximum Entropy Population-Based Training for Zero-Shot Human-AI Coordination	Dec 22, 2021	DiversityReinforcement Learning (RL)	CodeCode Available	1
Newsvendor Model with Deep Reinforcement Learning	Dec 22, 2021	Deep Reinforcement Learningmodel	CodeCode Available	0
Reinforcement Learning based Sequential Batch-sampling for Bayesian Optimal Experimental Design	Dec 21, 2021	Deep Reinforcement LearningExperimental Design	—Unverified	0
Nearly Optimal Policy Optimization with Stable at Any Time Guarantee	Dec 21, 2021	4kReinforcement Learning (RL)	—Unverified	0
Off Environment Evaluation Using Convex Risk Minimization	Dec 21, 2021	Reinforcement Learning (RL)	CodeCode Available	0
Soft Actor-Critic with Cross-Entropy Policy Optimization	Dec 21, 2021	Reinforcement Learning (RL)	CodeCode Available	0
District Cooling System Control for Providing Operating Reserve based on Safe Deep Reinforcement Learning	Dec 21, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Do Androids Dream of Electric Fences? Safety-Aware Reinforcement Learning with Latent Shielding	Dec 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Aerial Base Station Positioning and Power Control for Securing Communications: A Deep Q-Network Approach	Dec 21, 2021	PositionQ-Learning	—Unverified	0
A Scalable Deep Reinforcement Learning Model for Online Scheduling Coflows of Multi-Stage Jobs for High Performance Computing	Dec 21, 2021	Deep Reinforcement LearningGraph Neural Network	—Unverified	0

Show:10 25 50

← PrevPage 131 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified