Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3151–3160 of 15113 papers

Title	Date	Tasks	Status
Minimal Batch Adaptive Learning Policy Engine for Real-Time Mid-Price Forecasting in High-Frequency Trading	Dec 26, 2024	Feature ImportanceReinforcement Learning (RL)	—Unverified
Provably Efficient Exploration in Reward Machines with Low Regret	Dec 26, 2024	Efficient ExplorationReinforcement Learning (RL)	—Unverified
xSRL: Safety-Aware Explainable Reinforcement Learning -- Safety as a Product of Explainability	Dec 26, 2024	Autonomous VehiclesReinforcement Learning (RL)	CodeCode Available
Optimistic Critic Reconstruction and Constrained Fine-Tuning for General Offline-to-Online RL	Dec 25, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available
Quantum framework for Reinforcement Learning: Integrating Markov decision process, quantum arithmetic, and trajectory search	Dec 24, 2024	Computational EfficiencyDecision Making	—Unverified
Improving Multi-Step Reasoning Abilities of Large Language Models with Direct Advantage Policy Optimization	Dec 24, 2024	Offline RLReinforcement Learning (RL)	—Unverified
Multimodal Deep Reinforcement Learning for Portfolio Optimization	Dec 23, 2024	ArticlesBenchmarking	—Unverified
Optimizing Prompt Strategies for SAM: Advancing lesion Segmentation Across Diverse Medical Imaging Modalities	Dec 23, 2024	Lesion SegmentationReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Motor Control: A Comprehensive Review	Dec 23, 2024	reinforcement-learningReinforcement Learning	—Unverified
Environment Descriptions for Usability and Generalisation in Reinforcement Learning	Dec 22, 2024	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 316 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified