Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6501–6525 of 15113 papers

Title	Date	Tasks	Status	Hype
Leveraging Queue Length and Attention Mechanisms for Enhanced Traffic Signal Control Optimization	Dec 30, 2021	Reinforcement Learning (RL)Traffic Signal Control	CodeCode Available	1
Constraint Sampling Reinforcement Learning: Incorporating Expertise For Faster Learning	Dec 30, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
MORAL: Aligning AI with Human Norms through Multi-Objective Reinforced Active Learning	Dec 30, 2021	Active LearningEthics	CodeCode Available	0
Sequential memory improves sample and memory efficiency in Episodic Control	Dec 29, 2021	Deep Reinforcement LearningHippocampus	CodeCode Available	0
Control Theoretic Analysis of Temporal Difference Learning	Dec 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Modified DDPG car-following model with a real-world human driving experience with CARLA simulator	Dec 29, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Embodied Learning for Lifelong Visual Perception	Dec 28, 2021	Active LearningDeep Reinforcement Learning	—Unverified	0
Efficient Performance Bounds for Primal-Dual Reinforcement Learning from Demonstrations	Dec 28, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Exponential Family Model-Based Reinforcement Learning via Score Matching	Dec 28, 2021	Density EstimationModel-based Reinforcement Learning	CodeCode Available	0
Robustness and risk management via distributional dynamic programming	Dec 28, 2021	Distributional Reinforcement LearningManagement	—Unverified	0
The Statistical Complexity of Interactive Decision Making	Dec 27, 2021	Decision Makingreinforcement-learning	—Unverified	0
Safe Reinforcement Learning with Chance-constrained Model Predictive Control	Dec 27, 2021	Model Predictive Controlreinforcement-learning	—Unverified	0
RELDEC: Reinforcement Learning-Based Decoding of Moderate Length LDPC Codes	Dec 27, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Multiagent Model-based Credit Assignment for Continuous Control	Dec 27, 2021	continuous-controlContinuous Control	—Unverified	0
A Graph Attention Learning Approach to Antenna Tilt Optimization	Dec 27, 2021	Graph AttentionQ-Learning	—Unverified	0
Intelligent Traffic Light via Policy-based Deep Reinforcement Learning	Dec 27, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Improving the Performance of Backward Chained Behavior Trees that use Reinforcement Learning	Dec 27, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Can Reinforcement Learning Find Stackelberg-Nash Equilibria in General-Sum Markov Games with Myopic Followers?	Dec 27, 2021	Reinforcement Learning (RL)	—Unverified	0
Abstractions of General Reinforcement Learning	Dec 26, 2021	General Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning with Dynamic Convex Risk Measures	Dec 26, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Neuro-Symbolic Hierarchical Rule Induction	Dec 26, 2021	Inductive logic programmingreinforcement-learning	—Unverified	0
Reducing Planning Complexity of General Reinforcement Learning with Non-Markovian Abstractions	Dec 26, 2021	Decision MakingGeneral Reinforcement Learning	—Unverified	0
Dynamic Channel Access via Meta-Reinforcement Learning	Dec 24, 2021	channel selectionDeep Reinforcement Learning	—Unverified	0
A Survey on Interpretable Reinforcement Learning	Dec 24, 2021	Autonomous DrivingDecision Making	—Unverified	0
Lane Change Decision-Making through Deep Reinforcement Learning	Dec 24, 2021	Autonomous DrivingDecision Making	CodeCode Available	1

Show:10 25 50

← PrevPage 261 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified