Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6751–6775 of 15113 papers

Title	Date	Tasks	Status
Towards Optimal Pricing of Demand Response -- A Nonparametric Constrained Policy Optimization Approach	Jun 24, 2023	Reinforcement Learning (RL)	—Unverified
Towards Optimizing Human-Centric Objectives in AI-Assisted Decision-Making With Offline Reinforcement Learning	Mar 9, 2024	Decision MakingOffline RL	—Unverified
Towards personalized human AI interaction - adapting the behavior of AI agents using neural signatures of subjective interest	Sep 14, 2017	AI AgentBrain Computer Interface	—Unverified
Towards Physically Safe Reinforcement Learning under Supervision	Jan 19, 2019	OpenAI Gymreinforcement-learning	—Unverified
Towards Physiologically Sensible Predictions via the Rule-based Reinforcement Learning Layer	Jan 31, 2025	Reinforcement Learning (RL)	—Unverified
Towards Playing Full MOBA Games with Deep Reinforcement Learning	Nov 25, 2020	AI AgentDeep Reinforcement Learning	—Unverified
Towards Practical Credit Assignment for Deep Reinforcement Learning	Jun 8, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Towards Practical Deep Schedulers for Allocating Cellular Radio Resources	Nov 13, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Towards practical reinforcement learning for tokamak magnetic control	Jul 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
Towards Quantum-Enabled 6G Slicing	Oct 21, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
Towards Reinforcement Learning for Pivot-based Neural Machine Translation with Non-autoregressive Transformer	Sep 27, 2021	Machine TranslationNMT	—Unverified
Towards Resolving Unidentifiability in Inverse Reinforcement Learning	Jan 25, 2016	reinforcement-learningReinforcement Learning	—Unverified
Towards robust and domain agnostic reinforcement learning competitions	Jun 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Towards Robust Knowledge Graph Embedding via Multi-task Reinforcement Learning	Nov 11, 2021	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Towards Robust Model-Based Reinforcement Learning Against Adversarial Corruption	Feb 14, 2024	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement Learning	Jul 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and Defenses	May 18, 2024	D4RLOffline RL	—Unverified
Towards Safe Continuing Task Reinforcement Learning	Feb 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
Towards Safe Control of Continuum Manipulator Using Shielded Multiagent Reinforcement Learning	Jun 15, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Safe, Explainable, and Regulated Autonomous Driving	Nov 20, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Towards Real-World Applications of Personalized Anesthesia Using Policy Constraint Q Learning for Propofol Infusion Control	Mar 17, 2023	Q-Learningreinforcement-learning	—Unverified
Towards Sample-Efficiency and Generalization of Transfer and Inverse Reinforcement Learning: A Comprehensive Literature Review	Nov 15, 2024	Reinforcement Learning (RL)Sequential Decision Making	—Unverified
Towards sample-efficient episodic control with DAC-ML	Dec 26, 2020	Deep Reinforcement LearningHippocampus	—Unverified
Towards Simplicity in Deep Reinforcement Learning: Streamlined Off-Policy Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Towards Skilled Population Curriculum for Multi-Agent Reinforcement Learning	Feb 7, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 271 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified