Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10951–11000 of 15113 papers

Title	Date	Tasks	Status
Improving Proactive Dialog Agents Using Socially-Aware Reinforcement Learning	Nov 25, 2022	reinforcement-learningReinforcement Learning	—Unverified
Toward Simulating Environments in Reinforcement Learning Based Recommendations	Jun 27, 2019	Generative Adversarial NetworkRecommendation Systems	—Unverified
Towards Infant Sleep-Optimized Driving: Synergizing Wearable and Vehicle Sensing in Intelligent Cruise Control	Jun 6, 2025	Reinforcement Learning (RL)Sleep Quality	—Unverified
Towards Information-Seeking Agents	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards Instance-Optimal Offline Reinforcement Learning with Pessimism	Oct 17, 2021	Offline RLreinforcement-learning	—Unverified
Towards Intelligent Pick and Place Assembly of Individualized Products Using Reinforcement Learning	Feb 11, 2020	Meta-Learningreinforcement-learning	—Unverified
Towards Interpretable Deep Reinforcement Learning Models via Inverse Reinforcement Learning	Mar 30, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Towards intervention-centric causal reasoning in learning agents	May 26, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified
Towards Interactive Reinforcement Learning with Intrinsic Feedback	Dec 2, 2021	reinforcement-learningReinforcement Learning	—Unverified
Towards Inverse Reinforcement Learning for Limit Order Book Dynamics	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models	Jan 16, 2025	Reinforcement Learning (RL)	—Unverified
Towards Learning Abstractions via Reinforcement Learning	Dec 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning-automation IoT Attack Detection through Reinforcement Learning	Jun 29, 2020	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning Controllable Representations of Physical Systems	Nov 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning Rubik's Cube with N-tuple-based Reinforcement Learning	Jan 28, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning to Play Piano with Dexterous Hands and Touch	Jun 3, 2021	Reinforcement Learning (RL)	—Unverified
Towards Learning to Speak and Hear Through Multi-Agent Communication over a Continuous Acoustic Channel	Nov 4, 2021	Language AcquisitionMulti-agent Reinforcement Learning	—Unverified
Towards Machines that Trust: AI Agents Learn to Trust in the Trust Game	Dec 20, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Measuring Goal-Directedness in AI Systems	Oct 7, 2024	Reinforcement Learning (RL)	—Unverified
Towards Minimax Optimality of Model-based Robust Reinforcement Learning	Feb 10, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Minimax Optimal Reinforcement Learning in Factored Markov Decision Processes	Jun 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
Towards Mixed Optimization for Reinforcement Learning with Program Synthesis	Jul 1, 2018	Deep Reinforcement LearningProgram Repair	—Unverified
Towards model-free RL algorithms that scale well with unstructured data	Nov 3, 2023	Reinforcement Learning (RL)	—Unverified
Towards Modern Card Games with Large-Scale Action Spaces Through Action Representation	Jun 25, 2022	Card Gamesreinforcement-learning	—Unverified
Towards Modular Algorithm Induction	Feb 27, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Towards Modularity Optimization Using Reinforcement Learning to Community Detection in Dynamic Social Networks	Nov 25, 2021	Community Detectionreinforcement-learning	—Unverified
Towards More Efficient, Robust, Instance-adaptive, and Generalizable Sequential Decision making	Apr 12, 2025	Decision MakingDecision Making Under Uncertainty	—Unverified
Towards More Theoretically-Grounded Particle Optimization Sampling for Deep Learning	Sep 27, 2018	Deep LearningDeep Reinforcement Learning	—Unverified
Towards Multi-agent Reinforcement Learning for Wireless Network Protocol Synthesis	Feb 2, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann Machines	Sep 22, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Towards Multi-Agent Reinforcement Learning driven Over-The-Counter Market Simulations	Oct 13, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Towards Neural Machine Translation with Latent Tree Attention	Sep 6, 2017	DecoderMachine Translation	—Unverified
Towards one-shot learning for rare-word translation with external experts	Sep 10, 2018	Machine TranslationNMT	—Unverified
Towards on-sky adaptive optics control using reinforcement learning	May 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Towards Optimal Differentially Private Regret Bounds in Linear MDPs	Apr 12, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Towards Optimal District Heating Temperature Control in China with Deep Reinforcement Learning	Dec 17, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Towards Optimal Energy Management Strategy for Hybrid Electric Vehicle with Reinforcement Learning	May 21, 2023	energy managementManagement	—Unverified
Towards Optimal Pricing of Demand Response -- A Nonparametric Constrained Policy Optimization Approach	Jun 24, 2023	Reinforcement Learning (RL)	—Unverified
Towards Optimizing Human-Centric Objectives in AI-Assisted Decision-Making With Offline Reinforcement Learning	Mar 9, 2024	Decision MakingOffline RL	—Unverified
Towards personalized human AI interaction - adapting the behavior of AI agents using neural signatures of subjective interest	Sep 14, 2017	AI AgentBrain Computer Interface	—Unverified
Towards Physically Safe Reinforcement Learning under Supervision	Jan 19, 2019	OpenAI Gymreinforcement-learning	—Unverified
Towards Physiologically Sensible Predictions via the Rule-based Reinforcement Learning Layer	Jan 31, 2025	Reinforcement Learning (RL)	—Unverified
Towards Playing Full MOBA Games with Deep Reinforcement Learning	Nov 25, 2020	AI AgentDeep Reinforcement Learning	—Unverified
Towards Practical Credit Assignment for Deep Reinforcement Learning	Jun 8, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Towards Practical Deep Schedulers for Allocating Cellular Radio Resources	Nov 13, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Towards practical reinforcement learning for tokamak magnetic control	Jul 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Quantum-Enabled 6G Slicing	Oct 21, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
Towards Reinforcement Learning for Pivot-based Neural Machine Translation with Non-autoregressive Transformer	Sep 27, 2021	Machine TranslationNMT	—Unverified
Towards Resolving Unidentifiability in Inverse Reinforcement Learning	Jan 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards robust and domain agnostic reinforcement learning competitions	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 220 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified