Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10226–10250 of 15113 papers

Title	Date	Tasks	Status
Neural Topic Model with Reinforcement Learning	Nov 1, 2019	modelreinforcement-learning	—Unverified
Neural-to-Tree Policy Distillation with Policy Improvement Criterion	Aug 16, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Neural Trust Region/Proximal Policy Optimization Attains Globally Optimal Policy	Dec 1, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
NeurIPS 2021 Competition IGLU: Interactive Grounded Language Understanding in a Collaborative Environment	Oct 13, 2021	Natural Language UnderstandingReinforcement Learning (RL)	—Unverified
NeurIPS 2022 Competition: Driving SMARTS	Nov 14, 2022	Autonomous DrivingReinforcement Learning (RL)	—Unverified
NeuRL: Closed-form Inverse Reinforcement Learning for Neural Decoding	Apr 10, 2022	Formreinforcement-learning	—Unverified
Neuroevolution-Based Inverse Reinforcement Learning	Aug 9, 2016	reinforcement-learningReinforcement Learning	—Unverified
Neuromechanics-based Deep Reinforcement Learning of Neurostimulation Control in FES cycling	Mar 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Neuromuscular Reinforcement Learning to Actuate Human Limbs through FES	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Neuron Activation Analysis for Multi-Joint Robot Reinforcement Learning	Sep 28, 2020	reinforcement-learningReinforcement Learning	—Unverified
Neuron as an Agent	Jan 1, 2018	counterfactualMulti-agent Reinforcement Learning	—Unverified
Neuroprospecting with DeepRL agents	Sep 24, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Neuro-Symbolic Hierarchical Rule Induction	Dec 26, 2021	Inductive logic programmingreinforcement-learning	—Unverified
Neuro-symbolic Meta Reinforcement Learning for Trading	Jan 15, 2023	Decision MakingMeta Reinforcement Learning	—Unverified
Neurosymbolic Reinforcement Learning and Planning: A Survey	Sep 2, 2023	reinforcement-learningReinforcement Learning	—Unverified
Neuro-Symbolic Reinforcement Learning with First-Order Logic	Oct 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Neuro-Symbolic World Models for Adapting to Open World Novelty	Jan 16, 2023	Decision Makingreinforcement-learning	—Unverified
NeuSaver: Neural Adaptive Power Consumption Optimization for Mobile Video Streaming	Jul 15, 2021	Reinforcement Learning (RL)	—Unverified
Never too Prim to Swim: An LLM-Enhanced RL-based Adaptive S-Surface Controller for AUVs under Extreme Sea Conditions	Mar 1, 2025	Language ModelingLanguage Modelling	—Unverified
New Auction Algorithms for Path Planning, Network Transport, and Reinforcement Learning	Jul 19, 2022	reinforcement-learningReinforcement Learning	—Unverified
New Challenges in Reinforcement Learning: A Survey of Security and Privacy	Dec 31, 2022	Autonomous DrivingDecision Making	—Unverified
New Reinforcement Learning Using a Chaotic Neural Network for Emergence of "Thinking" - "Exploration" Grows into "Thinking" through Learning -	May 16, 2017	reinforcement-learningReinforcement Learning	—Unverified
News-based trading strategies	Jul 18, 2018	Decision MakingReinforcement Learning	—Unverified
Next-Future: Sample-Efficient Policy Learning for Robotic-Arm Tasks	Apr 15, 2025	Multi-Goal Reinforcement LearningReinforcement Learning (RL)	—Unverified
N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs	Nov 4, 2024	In-Context LearningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 410 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified