Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10601–10625 of 15113 papers

Title	Date	Tasks	Status
Exact Reduction of Huge Action Spaces in General Reinforcement Learning	Dec 18, 2020	BinarizationGeneral Reinforcement Learning	—Unverified
Examining average and discounted reward optimality criteria in reinforcement learning	Jul 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Example-Driven Model-Based Reinforcement Learning for Solving Long-Horizon Visuomotor Tasks	Sep 21, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Exchangeable Input Representations for Reinforcement Learning	Mar 19, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified
Excluding the Irrelevant: Focusing Reinforcement Learning through Continuous Action Masking	Jun 6, 2024	reinforcement-learningReinforcement Learning	—Unverified
Exclusively Penalized Q-learning for Offline Reinforcement Learning	May 23, 2024	Offline RLQ-Learning	—Unverified
Execute Order 66: Targeted Data Poisoning for Reinforcement Learning	Jan 3, 2022	Atari GamesData Poisoning	—Unverified
ExpanRL: Hierarchical Reinforcement Learning for Course Concept Expansion in MOOCs	Dec 1, 2020	DiversityHierarchical Reinforcement Learning	—Unverified
Expected Policy Gradients for Reinforcement Learning	Jan 10, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Expected Scalarised Returns Dominance: A New Solution Concept for Multi-Objective Decision Making	Jun 2, 2021	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
Experience Augmentation: Boosting and Accelerating Off-Policy Multi-Agent Reinforcement Learning	May 19, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Experience-Based Heuristic Search: Robust Motion Planning with Deep Q-Learning	Feb 5, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Experience-driven Networking: A Deep Reinforcement Learning based Approach	Jan 17, 2018	continuous-controlContinuous Control	—Unverified
Experience enrichment based task independent reward model	May 21, 2017	modelreinforcement-learning	—Unverified
Experience Replay More When It's a Key Transition in Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement LearningOpenAI Gym	—Unverified
Experience Replay Optimization	Jun 19, 2019	continuous-controlContinuous Control	—Unverified
Experience Replay Using Transition Sequences	May 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
Experience Sharing Between Cooperative Reinforcement Learning Agents	Nov 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Experimental analysis of data-driven control for a building heating system	Jul 13, 2015	Decision Makingreinforcement-learning	—Unverified
Experimental Analysis of Reinforcement Learning Techniques for Spectrum Sharing Radar	Jan 6, 2020	Q-Learningreinforcement-learning	—Unverified
Experimental Evidence that Empowerment May Drive Exploration in Sparse-Reward Environments	Jul 14, 2021	Reinforcement Learning (RL)	—Unverified
Experimental results : Reinforcement Learning of POMDPs using Spectral Methods	May 7, 2017	reinforcement-learningReinforcement Learning	—Unverified
Experimental Study on Reinforcement Learning-based Control of an Acrobot	Nov 18, 2020	Acrobotreinforcement-learning	—Unverified
Expert-Free Online Transfer Learning in Multi-Agent Reinforcement Learning	Mar 2, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Expert Level control of Ramp Metering based on Multi-task Deep Reinforcement Learning	Jan 30, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 425 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified