Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8276–8300 of 15113 papers

Title	Date	Tasks	Status
Offline Learning of Counterfactual Predictions for Real-World Robotic Reinforcement Learning	Nov 11, 2020	counterfactualreinforcement-learning	—Unverified
Offline Meta-level Model-based Reinforcement Learning Approach for Cold-Start Recommendation	Dec 4, 2020	Model-based Reinforcement LearningRecommendation Systems	—Unverified
Offline Model-Based Reinforcement Learning with Anti-Exploration	Aug 20, 2024	D4RLmodel	—Unverified
Offline Multi-Agent Reinforcement Learning with Coupled Value Factorization	Jun 15, 2023	ManagementMulti-agent Reinforcement Learning	—Unverified
Offline Multitask Representation Learning for Reinforcement Learning	Mar 18, 2024	reinforcement-learningReinforcement Learning	—Unverified
Offline Multi-task Transfer RL with Representational Penalization	Feb 19, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Offline-Online Reinforcement Learning: Extending Batch and Online RL	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Offline-Online Reinforcement Learning for Energy Pricing in Office Demand Response: Lowering Energy and Data Costs	Aug 14, 2021	reinforcement-learningReinforcement Learning	—Unverified
Offline Policy Evaluation and Optimization under Confounding	Nov 29, 2022	Offline RLOff-policy evaluation	—Unverified
Offline Policy Optimization in RL with Variance Regularizaton	Dec 29, 2022	continuous-controlContinuous Control	—Unverified
Offline Policy Optimization with Variance Regularization	Jan 1, 2021	continuous-controlContinuous Control	—Unverified
Offline Pre-trained Multi-Agent Decision Transformer	Sep 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Offline Primal-Dual Reinforcement Learning for Linear MDPs	May 22, 2023	Offline RLreinforcement-learning	—Unverified
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes	Nov 28, 2022	Offline RLQ-Learning	—Unverified
Offline Reinforcement Learning and Sequence Modeling for Downlink Link Adaptation	Oct 30, 2024	Offline RLQ-Learning	—Unverified
Offline Reinforcement Learning as Anti-Exploration	Jun 11, 2021	continuous-controlContinuous Control	—Unverified
Offline Reinforcement Learning at Multiple Frequencies	Jul 26, 2022	Offline RLreinforcement-learning	—Unverified
Offline Reinforcement Learning for Human-Guided Human-Machine Interaction with Private Information	Dec 23, 2022	Decision MakingOff-policy evaluation	—Unverified
Offline reinforcement learning for job-shop scheduling problems	Oct 21, 2024	Combinatorial OptimizationDeep Learning	—Unverified
Offline Reinforcement Learning for Large Scale Language Action Spaces	Sep 29, 2021	Language ModelingLanguage Modelling	—Unverified
Offline Reinforcement Learning for Mixture-of-Expert Dialogue Management	Feb 21, 2023	Dialogue ManagementDiversity	—Unverified
Offline Reinforcement Learning for Mobile Notifications	Feb 4, 2022	AttributeRecommendation Systems	—Unverified
Offline Reinforcement Learning for Road Traffic Control	Jan 7, 2022	Offline RLreinforcement-learning	—Unverified
Offline Reinforcement Learning for Wireless Network Optimization with Mixture Datasets	Nov 19, 2023	ManagementOffline RL	—Unverified
Offline Reinforcement Learning: Fundamental Barriers for Value Function Approximation	Nov 21, 2021	Decision MakingOffline RL	—Unverified

Show:10 25 50

← PrevPage 332 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified