Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3326–3350 of 15113 papers

Title	Date	Tasks	Status
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation	Nov 5, 2024	Fault DetectionIn-Context Learning	—Unverified
Pre-trained Visual Dynamics Representations for Efficient Policy Learning	Nov 5, 2024	Reinforcement Learning (RL)Video Prediction	—Unverified
When to Localize? A Risk-Constrained Reinforcement Learning Approach	Nov 5, 2024	reinforcement-learningReinforcement Learning	—Unverified
Embedding Safety into RL: A New Take on Trust Region Methods	Nov 5, 2024	Reinforcement Learning (RL)	—Unverified
An Open-source Sim2Real Approach for Sensor-independent Robot Navigation in a Grid	Nov 5, 2024	Autonomous NavigationReinforcement Learning (RL)	CodeCode Available
Show, Don't Tell: Learning Reward Machines from Demonstrations for Reinforcement Learning-Based Cardiac Pacemaker Synthesis	Nov 4, 2024	Reinforcement Learning (RL)	—Unverified
N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs	Nov 4, 2024	In-Context LearningReinforcement Learning (RL)	—Unverified
Risk-sensitive control as inference with Rényi divergence	Nov 4, 2024	Reinforcement Learning (RL)Variational Inference	CodeCode Available
So You Think You Can Scale Up Autonomous Robot Data Collection?	Nov 4, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
Simulation of Nanorobots with Artificial Intelligence and Reinforcement Learning for Advanced Cancer Cell Detection and Tracking	Nov 4, 2024	Cell DetectionNavigate	CodeCode Available
GITSR: Graph Interaction Transformer-based Scene Representation for Multi Vehicle Collaborative Decision-making	Nov 3, 2024	Decision MakingGraph Neural Network	—Unverified
Diversity Progress for Goal Selection in Discriminability-Motivated RL	Nov 3, 2024	DiversityReinforcement Learning (RL)	—Unverified
Hedging and Pricing Structured Products Featuring Multiple Underlying Assets	Nov 2, 2024	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
Prompt Tuning with Diffusion for Few-Shot Pre-trained Policy Generalization	Nov 2, 2024	Reinforcement Learning (RL)	—Unverified
StepCountJITAI: simulation environment for RL with application to physical activity adaptive intervention	Nov 1, 2024	Reinforcement Learning (RL)	CodeCode Available
AI-based traffic analysis in digital twin networks	Nov 1, 2024	FairnessFederated Learning	—Unverified
Statistical Guarantees for Lifelong Reinforcement Learning using PAC-Bayes Theory	Nov 1, 2024	reinforcement-learningReinforcement Learning	—Unverified
Towards Building Secure UAV Navigation with FHE-aware Knowledge Distillation	Nov 1, 2024	Knowledge DistillationReinforcement Learning (RL)	—Unverified
Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data Corruptions	Nov 1, 2024	Bayesian InferenceOffline RL	CodeCode Available
A Review of Reinforcement Learning in Financial Applications	Nov 1, 2024	BenchmarkingDecision Making	—Unverified
Effective ML Model Versioning in Edge Networks	Nov 1, 2024	modelreinforcement-learning	—Unverified
Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Use	Oct 31, 2024	DiversityInformativeness	CodeCode Available
Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs	Oct 31, 2024	Reinforcement Learning (RL)	—Unverified
Noise as a Double-Edged Sword: Reinforcement Learning Exploits Randomized Defenses in Neural Networks	Oct 31, 2024	Reinforcement Learning (RL)	—Unverified
EARL-BO: Reinforcement Learning for Multi-Step Lookahead, High-Dimensional Bayesian Optimization	Oct 31, 2024	Bayesian OptimizationDecision Making	—Unverified

Show:10 25 50

← PrevPage 134 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified