Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3475 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning with Linear Quadratic Regulator Regions	Feb 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
DeepMNavigate: Deep Reinforced Multi-Robot Navigation Unifying Local & Global Collision Avoidance	Oct 4, 2019	Collision AvoidanceDeep Reinforcement Learning	—Unverified
AutoEG: Automated Experience Grafting for Off-Policy Deep Reinforcement Learning	Apr 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Model Compression Via Two-Stage Deep Reinforcement Learning	Dec 4, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Counterfactual Explanation Policies in RL	Jul 25, 2023	counterfactualCounterfactual Explanation	—Unverified
A Strong Baseline for Batch Imitation Learning	Feb 6, 2023	continuous-controlContinuous Control	—Unverified
Auto-Encoding Adversarial Imitation Learning	Jun 22, 2022	Decision MakingImitation Learning	—Unverified
Deep Multi-Agent Reinforcement Learning with Discrete-Continuous Hybrid Action Spaces	Mar 12, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Deep Multi-Agent Reinforcement Learning with Hybrid Action Spaces based on Maximum Entropy	Jun 10, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Auto-Encoding Inverse Reinforcement Learning	Sep 29, 2021	Decision MakingImitation Learning	—Unverified
Counterfactual Credit Assignment in Model-Free Reinforcement Learning	Nov 18, 2020	counterfactualmodel	—Unverified
Developing parsimonious ensembles using ensemble diversity within a reinforcement learning framework	May 5, 2018	Diversityreinforcement-learning	—Unverified
A Learning Framework for High Precision Industrial Assembly	Sep 23, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep Occupancy-Predictive Representations for Autonomous Driving	Mar 7, 2023	Autonomous DrivingAutonomous Vehicles	—Unverified
Deep Offline Reinforcement Learning for Real-world Treatment Optimization Applications	Feb 15, 2023	Decision MakingManagement	—Unverified
Uniform Last-Iterate Guarantee for Bandits and Reinforcement Learning	Feb 20, 2024	reinforcement-learningReinforcement Learning	—Unverified
Deep Page-Level Interest Network in Reinforcement Learning for Ads Allocation	Apr 1, 2022	Click-Through Rate Predictionreinforcement-learning	—Unverified
Policy Zooming: Adaptive Discretization-based Infinite-Horizon Average-Reward Reinforcement Learning	May 29, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified
Deep Pepper: Expert Iteration based Chess agent in the Reinforcement Learning Setting	Jun 2, 2018	reinforcement-learningReinforcement Learning	—Unverified
DeepPlace: Learning to Place Applications in Multi-Tenant Clusters	Jul 30, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
A physics-informed reinforcement learning approach for the interfacial area transport in two-phase flow	Aug 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Agent based modelling for continuously varying supply chains	Dec 24, 2023	reinforcement-learningReinforcement Learning	—Unverified
DeepPool: Distributed Model-free Algorithm for Ride-sharing using Deep Reinforcement Learning	Mar 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Primal-Dual Reinforcement Learning: Accelerating Actor-Critic using Bellman Duality	Dec 7, 2017	Q-Learningreinforcement-learning	—Unverified
Accelerating the Computation of UCB and Related Indices for Reinforcement Learning	Sep 28, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 139 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified