Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10976–11000 of 15113 papers

Title	Date	Tasks	Status
Towards Modularity Optimization Using Reinforcement Learning to Community Detection in Dynamic Social Networks	Nov 25, 2021	Community Detectionreinforcement-learning	—Unverified
Towards More Efficient, Robust, Instance-adaptive, and Generalizable Sequential Decision making	Apr 12, 2025	Decision MakingDecision Making Under Uncertainty	—Unverified
Towards More Theoretically-Grounded Particle Optimization Sampling for Deep Learning	Sep 27, 2018	Deep LearningDeep Reinforcement Learning	—Unverified
Towards Multi-agent Reinforcement Learning for Wireless Network Protocol Synthesis	Feb 2, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann Machines	Sep 22, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Towards Multi-Agent Reinforcement Learning driven Over-The-Counter Market Simulations	Oct 13, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Towards Neural Machine Translation with Latent Tree Attention	Sep 6, 2017	DecoderMachine Translation	—Unverified
Towards one-shot learning for rare-word translation with external experts	Sep 10, 2018	Machine TranslationNMT	—Unverified
Towards on-sky adaptive optics control using reinforcement learning	May 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Towards Optimal Differentially Private Regret Bounds in Linear MDPs	Apr 12, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Towards Optimal District Heating Temperature Control in China with Deep Reinforcement Learning	Dec 17, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Towards Optimal Energy Management Strategy for Hybrid Electric Vehicle with Reinforcement Learning	May 21, 2023	energy managementManagement	—Unverified
Towards Optimal Pricing of Demand Response -- A Nonparametric Constrained Policy Optimization Approach	Jun 24, 2023	Reinforcement Learning (RL)	—Unverified
Towards Optimizing Human-Centric Objectives in AI-Assisted Decision-Making With Offline Reinforcement Learning	Mar 9, 2024	Decision MakingOffline RL	—Unverified
Towards personalized human AI interaction - adapting the behavior of AI agents using neural signatures of subjective interest	Sep 14, 2017	AI AgentBrain Computer Interface	—Unverified
Towards Physically Safe Reinforcement Learning under Supervision	Jan 19, 2019	OpenAI Gymreinforcement-learning	—Unverified
Towards Physiologically Sensible Predictions via the Rule-based Reinforcement Learning Layer	Jan 31, 2025	Reinforcement Learning (RL)	—Unverified
Towards Playing Full MOBA Games with Deep Reinforcement Learning	Nov 25, 2020	AI AgentDeep Reinforcement Learning	—Unverified
Towards Practical Credit Assignment for Deep Reinforcement Learning	Jun 8, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Towards Practical Deep Schedulers for Allocating Cellular Radio Resources	Nov 13, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Towards practical reinforcement learning for tokamak magnetic control	Jul 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Quantum-Enabled 6G Slicing	Oct 21, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
Towards Reinforcement Learning for Pivot-based Neural Machine Translation with Non-autoregressive Transformer	Sep 27, 2021	Machine TranslationNMT	—Unverified
Towards Resolving Unidentifiability in Inverse Reinforcement Learning	Jan 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards robust and domain agnostic reinforcement learning competitions	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 440 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified