Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 15113 papers

Title	Date	Tasks	Status	Hype
Test Where Decisions Matter: Importance-driven Testing for Deep Reinforcement Learning	Nov 12, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Overcoming the Curse of Dimensionality in Reinforcement Learning Through Approximate Factorization	Nov 12, 2024	Q-LearningReinforcement Learning (RL)	—Unverified	0
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified	0
Robust Offline Reinforcement Learning for Non-Markovian Decision Processes	Nov 12, 2024	Dataset Distillationreinforcement-learning	—Unverified	0
QuadWBG: Generalizable Quadrupedal Whole-Body Grasping	Nov 11, 2024	Reinforcement Learning (RL)Transparent objects	—Unverified	0
Reinforcement learning for Quantum Tiq-Taq-Toe	Nov 10, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	0
CROPS: A Deployable Crop Management System Over All Possible State Availabilities	Nov 9, 2024	AllManagement	—Unverified	0
Fine-Grained Reward Optimization for Machine Translation using Error Severity Mappings	Nov 8, 2024	DecoderMachine Translation	—Unverified	0
Emergent Cooperative Strategies for Multi-Agent Shepherding via Reinforcement Learning	Nov 8, 2024	Reinforcement Learning (RL)	—Unverified	0
Improving Multi-Domain Task-Oriented Dialogue System with Offline Reinforcement Learning	Nov 8, 2024	Language ModelingLanguage Modelling	—Unverified	0
Plasticity Loss in Deep Reinforcement Learning: A Survey	Nov 7, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping	Nov 7, 2024	Deep Reinforcement LearningMotion Planning	—Unverified	0
Sharp Analysis for KL-Regularized Contextual Bandits and RLHF	Nov 7, 2024	Multi-Armed BanditsReinforcement Learning (RL)	—Unverified	0
A Reinforcement Learning-Based Automatic Video Editing Method Using Pre-trained Vision-Language Model	Nov 7, 2024	Language ModelingLanguage Modelling	—Unverified	0
Noisy Zero-Shot Coordination: Breaking The Common Knowledge Assumption In Zero-Shot Coordination Games	Nov 7, 2024	Meta-LearningReinforcement Learning (RL)	CodeCode Available	0
Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations	Nov 7, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
Think Smart, Act SMARL! Analyzing Probabilistic Logic Shields for Multi-Agent Reinforcement Learning	Nov 7, 2024	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	0
Enabling Adaptive Agent Training in Open-Ended Simulators by Targeting Diversity	Nov 7, 2024	DiversityMeta Reinforcement Learning	CodeCode Available	0
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning	Nov 7, 2024	Offline RLPolicy Gradient Methods	—Unverified	0
Opportunities of Reinforcement Learning in South Africa's Just Transition	Nov 6, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
Approximate Equivariance in Reinforcement Learning	Nov 6, 2024	continuous-controlContinuous Control	—Unverified	0
A Comparative Study of Deep Reinforcement Learning for Crop Production Management	Nov 6, 2024	Deep Reinforcement LearningManagement	—Unverified	0
Interpretable and Efficient Data-driven Discovery and Control of Distributed Systems	Nov 6, 2024	Dimensionality ReductionReinforcement Learning (RL)	—Unverified	0
Hybrid Transfer Reinforcement Learning: Provable Sample Efficiency from Shifted-Dynamics Data	Nov 6, 2024	Reinforcement Learning (RL)Transfer Reinforcement Learning	CodeCode Available	0
Beyond The Rainbow: High Performance Deep Reinforcement Learning on a Desktop PC	Nov 6, 2024	Computational EfficiencyDeep Reinforcement Learning	CodeCode Available	1
An Open-source Sim2Real Approach for Sensor-independent Robot Navigation in a Grid	Nov 5, 2024	Autonomous NavigationReinforcement Learning (RL)	CodeCode Available	0
Pre-trained Visual Dynamics Representations for Efficient Policy Learning	Nov 5, 2024	Reinforcement Learning (RL)Video Prediction	—Unverified	0
Embedding Safety into RL: A New Take on Trust Region Methods	Nov 5, 2024	Reinforcement Learning (RL)	—Unverified	0
When to Localize? A Risk-Constrained Reinforcement Learning Approach	Nov 5, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation	Nov 5, 2024	Fault DetectionIn-Context Learning	—Unverified	0
N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs	Nov 4, 2024	In-Context LearningReinforcement Learning (RL)	—Unverified	0
Risk-sensitive control as inference with Rényi divergence	Nov 4, 2024	Reinforcement Learning (RL)Variational Inference	CodeCode Available	0
Show, Don't Tell: Learning Reward Machines from Demonstrations for Reinforcement Learning-Based Cardiac Pacemaker Synthesis	Nov 4, 2024	Reinforcement Learning (RL)	—Unverified	0
Simulation of Nanorobots with Artificial Intelligence and Reinforcement Learning for Advanced Cancer Cell Detection and Tracking	Nov 4, 2024	Cell DetectionNavigate	CodeCode Available	0
So You Think You Can Scale Up Autonomous Robot Data Collection?	Nov 4, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Diversity Progress for Goal Selection in Discriminability-Motivated RL	Nov 3, 2024	DiversityReinforcement Learning (RL)	—Unverified	0
GITSR: Graph Interaction Transformer-based Scene Representation for Multi Vehicle Collaborative Decision-making	Nov 3, 2024	Decision MakingGraph Neural Network	—Unverified	0
Hedging and Pricing Structured Products Featuring Multiple Underlying Assets	Nov 2, 2024	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Prompt Tuning with Diffusion for Few-Shot Pre-trained Policy Generalization	Nov 2, 2024	Reinforcement Learning (RL)	—Unverified	0
StepCountJITAI: simulation environment for RL with application to physical activity adaptive intervention	Nov 1, 2024	Reinforcement Learning (RL)	CodeCode Available	0
A Review of Reinforcement Learning in Financial Applications	Nov 1, 2024	BenchmarkingDecision Making	—Unverified	0
Towards Building Secure UAV Navigation with FHE-aware Knowledge Distillation	Nov 1, 2024	Knowledge DistillationReinforcement Learning (RL)	—Unverified	0
AI-based traffic analysis in digital twin networks	Nov 1, 2024	FairnessFederated Learning	—Unverified	0
Statistical Guarantees for Lifelong Reinforcement Learning using PAC-Bayes Theory	Nov 1, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data Corruptions	Nov 1, 2024	Bayesian InferenceOffline RL	CodeCode Available	0
Effective ML Model Versioning in Edge Networks	Nov 1, 2024	modelreinforcement-learning	—Unverified	0
EARL-BO: Reinforcement Learning for Multi-Step Lookahead, High-Dimensional Bayesian Optimization	Oct 31, 2024	Bayesian OptimizationDecision Making	—Unverified	0
Scalable Reinforcement Post-Training Beyond Static Human Prompts: Evolving Alignment via Asymmetric Self-Play	Oct 31, 2024	Reinforcement Learning (RL)	—Unverified	0
Maximum Entropy Hindsight Experience Replay	Oct 31, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
Deterministic Exploration via Stationary Bellman Error Maximization	Oct 31, 2024	Reinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 27 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified