Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10926–10950 of 15113 papers

Title	Date	Tasks	Status
Towards deep learning with spiking neurons in energy based models with contrastive Hebbian plasticity	Dec 9, 2016	Deep LearningGeneral Classification	—Unverified
Towards deep observation: A systematic survey on artificial intelligence techniques to monitor fetus via Ultrasound Images	Jan 17, 2022	AnatomyMiscellaneous	—Unverified
Towards Deep Symbolic Reinforcement Learning	Sep 18, 2016	Deep Reinforcement LearningGame of Go	—Unverified
Towards Deployable RL - What's Broken with RL Research and a Potential Fix	Jan 3, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Deployment-Efficient Reinforcement Learning: Lower Bound and Optimality	Feb 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Efficient Connected and Automated Driving System with Multi-agent Graph Reinforcement Learning	Jul 6, 2020	Decision Makingreinforcement-learning	—Unverified
Towards Efficient Multi-Objective Optimisation for Real-World Power Grid Topology Control	Jan 24, 2025	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Towards Efficient Risk-Sensitive Policy Gradient: An Iteration Complexity Analysis	Mar 13, 2024	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Toward Self-learning End-to-End Task-Oriented Dialog Systems	Jan 18, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Embodied Scene Description	Apr 30, 2020	Imitation Learningreinforcement-learning	—Unverified
Towards End-to-End Learning for Efficient Dialogue Agent by Modeling Looking-ahead Ability	Aug 15, 2019	reinforcement-learningReinforcement Learning	—Unverified
Towards Experienced Anomaly Detector through Reinforcement Learning	Apr 29, 2018	Anomaly Detectionreinforcement-learning	—Unverified
Towards Explainable and Controllable Open Domain Dialogue Generation with Dialogue Acts	Jul 19, 2018	Dialogue Generationreinforcement-learning	—Unverified
Towards General and Autonomous Learning of Core Skills: A Case Study in Locomotion	Aug 6, 2020	Reinforcement Learning (RL)	—Unverified
Towards Generalist Robot Learning from Internet Video: A Survey	Apr 30, 2024	Natural Language UnderstandingReinforcement Learning (RL)	—Unverified
Towards Generalizable Agents in Text-Based Educational Environments: A Study of Integrating RL with LLMs	Apr 29, 2024	DiagnosticGeneral Knowledge	—Unverified
Towards Generalizable Reinforcement Learning for Trade Execution	May 12, 2023	Offline RLreinforcement-learning	—Unverified
Towards Generalizable Reinforcement Learning via Causality-Guided Self-Adaptive Representations	Jul 30, 2024	Atari Gamesreinforcement-learning	—Unverified
Towards General-Purpose Model-Free Reinforcement Learning	Jan 27, 2025	modelreinforcement-learning	—Unverified
Towards Global Optimality in Cooperative MARL with the Transformation And Distillation Framework	Jul 12, 2022	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified
Towards Governing Agent's Efficacy: Action-Conditional β-VAE for Deep Transparent Reinforcement Learning	Nov 11, 2018	reinforcement-learningReinforcement Learning	—Unverified
Towards Hardware-Specific Automatic Compression of Neural Networks	Dec 15, 2022	Quantizationreinforcement-learning	—Unverified
Towards Heterogeneous Multi-Agent Reinforcement Learning with Graph Neural Networks	Sep 28, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Towards Human-Centered Construction Robotics: A Reinforcement Learning-Driven Companion Robot for Contextually Assisting Carpentry Workers	Mar 27, 2024	Reinforcement Learning (RL)	—Unverified
Data-Efficient Learning for Complex and Real-Time Physical Problem Solving using Augmented Simulation	Nov 14, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified

Show:10 25 50

← PrevPage 438 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified