Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6701–6725 of 15113 papers

Title	Date	Tasks	Status
Towards Explainable and Controllable Open Domain Dialogue Generation with Dialogue Acts	Jul 19, 2018	Dialogue Generationreinforcement-learning	—Unverified
Towards General and Autonomous Learning of Core Skills: A Case Study in Locomotion	Aug 6, 2020	Reinforcement Learning (RL)	—Unverified
Towards Generalist Robot Learning from Internet Video: A Survey	Apr 30, 2024	Natural Language UnderstandingReinforcement Learning (RL)	—Unverified
Towards Generalizable Agents in Text-Based Educational Environments: A Study of Integrating RL with LLMs	Apr 29, 2024	DiagnosticGeneral Knowledge	—Unverified
Towards Generalizable Reinforcement Learning for Trade Execution	May 12, 2023	Offline RLreinforcement-learning	—Unverified
Towards Generalizable Reinforcement Learning via Causality-Guided Self-Adaptive Representations	Jul 30, 2024	Atari Gamesreinforcement-learning	—Unverified
Towards General-Purpose Model-Free Reinforcement Learning	Jan 27, 2025	modelreinforcement-learning	—Unverified
Towards Global Optimality in Cooperative MARL with the Transformation And Distillation Framework	Jul 12, 2022	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Towards Governing Agent's Efficacy: Action-Conditional β-VAE for Deep Transparent Reinforcement Learning	Nov 11, 2018	reinforcement-learningReinforcement Learning	—Unverified
Towards Hardware-Specific Automatic Compression of Neural Networks	Dec 15, 2022	Quantizationreinforcement-learning	—Unverified
Towards Heterogeneous Multi-Agent Reinforcement Learning with Graph Neural Networks	Sep 28, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Towards Human-Centered Construction Robotics: A Reinforcement Learning-Driven Companion Robot for Contextually Assisting Carpentry Workers	Mar 27, 2024	Reinforcement Learning (RL)	—Unverified
Data-Efficient Learning for Complex and Real-Time Physical Problem Solving using Augmented Simulation	Nov 14, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified
Improving Proactive Dialog Agents Using Socially-Aware Reinforcement Learning	Nov 25, 2022	reinforcement-learningReinforcement Learning	—Unverified
Toward Simulating Environments in Reinforcement Learning Based Recommendations	Jun 27, 2019	Generative Adversarial NetworkRecommendation Systems	—Unverified
Towards Infant Sleep-Optimized Driving: Synergizing Wearable and Vehicle Sensing in Intelligent Cruise Control	Jun 6, 2025	Reinforcement Learning (RL)Sleep Quality	—Unverified
Towards Information-Seeking Agents	Dec 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards Instance-Optimal Offline Reinforcement Learning with Pessimism	Oct 17, 2021	Offline RLreinforcement-learning	—Unverified
Towards Intelligent Pick and Place Assembly of Individualized Products Using Reinforcement Learning	Feb 11, 2020	Meta-Learningreinforcement-learning	—Unverified
Towards Interpretable Deep Reinforcement Learning Models via Inverse Reinforcement Learning	Mar 30, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Towards intervention-centric causal reasoning in learning agents	May 26, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified
Towards Interactive Reinforcement Learning with Intrinsic Feedback	Dec 2, 2021	reinforcement-learningReinforcement Learning	—Unverified
Towards Inverse Reinforcement Learning for Limit Order Book Dynamics	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models	Jan 16, 2025	Reinforcement Learning (RL)	—Unverified
Towards Learning Abstractions via Reinforcement Learning	Dec 28, 2022	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 269 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified