Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11101–11150 of 15113 papers

Title	Date	Tasks	Status
Transferring Reinforcement Learning for DC-DC Buck Converter Control via Duty Ratio Mapping: From Simulation to Implementation	Oct 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Transfer RL across Observation Feature Spaces via Model-Based Regularization	Jan 1, 2022	Reinforcement Learning (RL)	—Unverified
Transfer Value or Policy? A Value-centric Framework Towards Transferrable Continuous Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Transfer with Model Features in Reinforcement Learning	Jul 4, 2018	modelreinforcement-learning	—Unverified
Transformation Coding: Simple Objectives for Equivariant Representations	Feb 19, 2022	Disentanglementreinforcement-learning	—Unverified
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation	Nov 5, 2024	Fault DetectionIn-Context Learning	—Unverified
Transformer Based Reinforcement Learning For Games	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Transformer Network-based Reinforcement Learning Method for Power Distribution Network (PDN) Optimization of High Bandwidth Memory (HBM)	Mar 29, 2022	Reinforcement Learning (RL)	—Unverified
Transformers are Meta-Reinforcement Learners	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Transformers as Game Players: Provable In-context Game-playing Capabilities of Pre-trained Models	Oct 13, 2024	In-Context LearningReinforcement Learning (RL)	—Unverified
Transformers in Reinforcement Learning: A Survey	Jul 12, 2023	Cloud ComputingCombinatorial Optimization	—Unverified
Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning	Sep 15, 2017	Deep Reinforcement LearningManagement	—Unverified
Transforming Multimodal Models into Action Models for Radiotherapy	Feb 6, 2025	AnatomyFew-Shot Learning	—Unverified
Transform then Explore: a Simple and Effective Technique for Exploratory Combinatorial Optimization with Reinforcement Learning	Apr 6, 2024	Combinatorial OptimizationFeature Engineering	—Unverified
Transmit Power Control for Indoor Small Cells: A Method Based on Federated Reinforcement Learning	Aug 31, 2022	reinforcement-learningReinforcement Learning	—Unverified
Transparency and Explanation in Deep Reinforcement Learning Neural Networks	Sep 17, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Transportation-Inequalities, Lyapunov Stability and Sampling for Dynamical Systems on Continuous State Space	May 25, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Tree-Structured Reinforcement Learning for Sequential Object Localization	Mar 8, 2017	DiversityObject	—Unverified
Trends in Neural Architecture Search: Towards the Acceleration of Search	Aug 19, 2021	Evolutionary AlgorithmsNeural Architecture Search	—Unverified
Triangular Dropout: Variable Network Width without Retraining	Sep 29, 2021	Lifelong learningReinforcement Learning (RL)	—Unverified
Triangular Dropout: Variable Network Width without Retraining	May 2, 2022	Reinforcement Learning (RL)	—Unverified
TrojanForge: Generating Adversarial Hardware Trojan Examples Using Reinforcement Learning	May 24, 2024	reinforcement-learningReinforcement Learning	—Unverified
Truncated Emphatic Temporal Difference Methods for Prediction and Control	Aug 11, 2021	PredictionReinforcement Learning (RL)	—Unverified
Truncated Horizon Policy Search: Combining Reinforcement Learning & Imitation Learning	May 29, 2018	Imitation Learningreinforcement-learning	—Unverified
Truncating Trajectories in Monte Carlo Reinforcement Learning	May 7, 2023	reinforcement-learningReinforcement Learning	—Unverified
Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach	Oct 17, 2024	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Trust-based Consensus in Multi-Agent Reinforcement Learning Systems	May 25, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Trust-PCL: An Off-Policy Trust Region Method for Continuous Control	Jul 6, 2017	continuous-controlContinuous Control	—Unverified
Trust the Model When It Is Confident: Masked Model-based Actor-Critic	Oct 10, 2020	continuous-controlContinuous Control	—Unverified
Trustworthy Federated Learning via Blockchain	Aug 13, 2022	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Trustworthy Reinforcement Learning Against Intrinsic Vulnerabilities: Robustness, Safety, and Generalizability	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Tsallis Reinforcement Learning: A Unified Framework for Maximum Entropy Reinforcement Learning	Jan 31, 2019	MuJoCoreinforcement-learning	—Unverified
t-Soft Update of Target Network for Deep Reinforcement Learning	Aug 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Tuning computer vision models with task rewards	Feb 16, 2023	ColorizationImage Captioning	—Unverified
Tuning Mixed Input Hyperparameters on the Fly for Efficient Population Based AutoRL	Jun 30, 2021	Data AugmentationHyperparameter Optimization	—Unverified
Tuning Path Tracking Controllers for Autonomous Cars Using Reinforcement Learning	Jan 9, 2023	NavigateQ-Learning	—Unverified
Turbulence control in plane Couette flow using low-dimensional neural ODE-based models and deep reinforcement learning	Jan 28, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Turning Mathematics Problems into Games: Reinforcement Learning and Gröbner bases together solve Integer Feasibility Problems	Aug 25, 2022	Reinforcement Learning (RL)	—Unverified
Tutorial and Survey on Probabilistic Graphical Model and Variational Inference in Deep Reinforcement Learning	Aug 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Tutorial on Course-of-Action (COA) Attack Search Methods in Computer Networks	May 27, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Tutoring Reinforcement Learning via Feedback Control	Dec 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
TW-CRL: Time-Weighted Contrastive Reward Learning for Efficient Inverse Reinforcement Learning	Apr 8, 2025	reinforcement-learningReinforcement Learning	—Unverified
Twisting Lids Off with Two Hands	Mar 4, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Two Approaches to Building Collaborative, Task-Oriented Dialog Agents through Self-Play	Sep 20, 2021	reinforcement-learningReinforcement Learning	—Unverified
Two Can Play That Game: An Adversarial Evaluation of a Cyber-alert Inspection System	Oct 13, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Two-dimensional Anti-jamming Mobile Communication Based on Reinforcement Learning	Dec 19, 2017	reinforcement-learningReinforcement Learning	—Unverified
Two geometric input transformation methods for fast online reinforcement learning with neural nets	May 18, 2018	reinforcement-learningReinforcement Learning	—Unverified
Two-Hop Age of Information Scheduling for Multi-UAV Assisted Mobile Edge Computing: FRL vs MADDPG	Jun 19, 2022	Deep Reinforcement LearningEdge-computing	—Unverified
Two-stage Deep Reinforcement Learning for Inverter-based Volt-VAR Control in Active Distribution Networks	May 20, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Efficiently Training Deep-Learning Parametric Policies using Lagrangian Duality	May 23, 2024	Decision MakingDecision Making Under Uncertainty	—Unverified

Show:10 25 50

← PrevPage 223 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified