Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6726–6750 of 15113 papers

Title	Date	Tasks	Status
Towards Learning-automation IoT Attack Detection through Reinforcement Learning	Jun 29, 2020	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning Controllable Representations of Physical Systems	Nov 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning Rubik's Cube with N-tuple-based Reinforcement Learning	Jan 28, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Learning to Play Piano with Dexterous Hands and Touch	Jun 3, 2021	Reinforcement Learning (RL)	—Unverified
Towards Learning to Speak and Hear Through Multi-Agent Communication over a Continuous Acoustic Channel	Nov 4, 2021	Language AcquisitionMulti-agent Reinforcement Learning	—Unverified
Towards Machines that Trust: AI Agents Learn to Trust in the Trust Game	Dec 20, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Measuring Goal-Directedness in AI Systems	Oct 7, 2024	Reinforcement Learning (RL)	—Unverified
Towards Minimax Optimality of Model-based Robust Reinforcement Learning	Feb 10, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Minimax Optimal Reinforcement Learning in Factored Markov Decision Processes	Jun 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
Towards Mixed Optimization for Reinforcement Learning with Program Synthesis	Jul 1, 2018	Deep Reinforcement LearningProgram Repair	—Unverified
Towards model-free RL algorithms that scale well with unstructured data	Nov 3, 2023	Reinforcement Learning (RL)	—Unverified
Towards Modern Card Games with Large-Scale Action Spaces Through Action Representation	Jun 25, 2022	Card Gamesreinforcement-learning	—Unverified
Towards Modular Algorithm Induction	Feb 27, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Towards Modularity Optimization Using Reinforcement Learning to Community Detection in Dynamic Social Networks	Nov 25, 2021	Community Detectionreinforcement-learning	—Unverified
Towards More Efficient, Robust, Instance-adaptive, and Generalizable Sequential Decision making	Apr 12, 2025	Decision MakingDecision Making Under Uncertainty	—Unverified
Towards More Theoretically-Grounded Particle Optimization Sampling for Deep Learning	Sep 27, 2018	Deep LearningDeep Reinforcement Learning	—Unverified
Towards Multi-agent Reinforcement Learning for Wireless Network Protocol Synthesis	Feb 2, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann Machines	Sep 22, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Towards Multi-Agent Reinforcement Learning driven Over-The-Counter Market Simulations	Oct 13, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Towards Neural Machine Translation with Latent Tree Attention	Sep 6, 2017	DecoderMachine Translation	—Unverified
Towards one-shot learning for rare-word translation with external experts	Sep 10, 2018	Machine TranslationNMT	—Unverified
Towards on-sky adaptive optics control using reinforcement learning	May 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Towards Optimal Differentially Private Regret Bounds in Linear MDPs	Apr 12, 2025	Offline RLReinforcement Learning (RL)	—Unverified
Towards Optimal District Heating Temperature Control in China with Deep Reinforcement Learning	Dec 17, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Towards Optimal Energy Management Strategy for Hybrid Electric Vehicle with Reinforcement Learning	May 21, 2023	energy managementManagement	—Unverified

Show:10 25 50

← PrevPage 270 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified