Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11101–11125 of 15113 papers

Title	Date	Tasks	Status
Transferring Reinforcement Learning for DC-DC Buck Converter Control via Duty Ratio Mapping: From Simulation to Implementation	Oct 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Transfer RL across Observation Feature Spaces via Model-Based Regularization	Jan 1, 2022	Reinforcement Learning (RL)	—Unverified
Transfer Value or Policy? A Value-centric Framework Towards Transferrable Continuous Reinforcement Learning	Sep 27, 2018	continuous-controlContinuous Control	—Unverified
Transfer with Model Features in Reinforcement Learning	Jul 4, 2018	modelreinforcement-learning	—Unverified
Transformation Coding: Simple Objectives for Equivariant Representations	Feb 19, 2022	Disentanglementreinforcement-learning	—Unverified
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation	Nov 5, 2024	Fault DetectionIn-Context Learning	—Unverified
Transformer Based Reinforcement Learning For Games	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Transformer Network-based Reinforcement Learning Method for Power Distribution Network (PDN) Optimization of High Bandwidth Memory (HBM)	Mar 29, 2022	Reinforcement Learning (RL)	—Unverified
Transformers are Meta-Reinforcement Learners	Sep 29, 2021	continuous-controlContinuous Control	—Unverified
Transformers as Game Players: Provable In-context Game-playing Capabilities of Pre-trained Models	Oct 13, 2024	In-Context LearningReinforcement Learning (RL)	—Unverified
Transformers in Reinforcement Learning: A Survey	Jul 12, 2023	Cloud ComputingCombinatorial Optimization	—Unverified
Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning	Sep 15, 2017	Deep Reinforcement LearningManagement	—Unverified
Transforming Multimodal Models into Action Models for Radiotherapy	Feb 6, 2025	AnatomyFew-Shot Learning	—Unverified
Transform then Explore: a Simple and Effective Technique for Exploratory Combinatorial Optimization with Reinforcement Learning	Apr 6, 2024	Combinatorial OptimizationFeature Engineering	—Unverified
Transmit Power Control for Indoor Small Cells: A Method Based on Federated Reinforcement Learning	Aug 31, 2022	reinforcement-learningReinforcement Learning	—Unverified
Transparency and Explanation in Deep Reinforcement Learning Neural Networks	Sep 17, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Transportation-Inequalities, Lyapunov Stability and Sampling for Dynamical Systems on Continuous State Space	May 25, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Tree-Structured Reinforcement Learning for Sequential Object Localization	Mar 8, 2017	DiversityObject	—Unverified
Trends in Neural Architecture Search: Towards the Acceleration of Search	Aug 19, 2021	Evolutionary AlgorithmsNeural Architecture Search	—Unverified
Triangular Dropout: Variable Network Width without Retraining	Sep 29, 2021	Lifelong learningReinforcement Learning (RL)	—Unverified
Triangular Dropout: Variable Network Width without Retraining	May 2, 2022	Reinforcement Learning (RL)	—Unverified
TrojanForge: Generating Adversarial Hardware Trojan Examples Using Reinforcement Learning	May 24, 2024	reinforcement-learningReinforcement Learning	—Unverified
Truncated Emphatic Temporal Difference Methods for Prediction and Control	Aug 11, 2021	PredictionReinforcement Learning (RL)	—Unverified
Truncated Horizon Policy Search: Combining Reinforcement Learning & Imitation Learning	May 29, 2018	Imitation Learningreinforcement-learning	—Unverified
Truncating Trajectories in Monte Carlo Reinforcement Learning	May 7, 2023	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 445 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified