Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4826–4850 of 15113 papers

Title	Date	Tasks	Status
DIP-RL: Demonstration-Inferred Preference Learning in Minecraft	Jul 22, 2023	Decision MakingMinecraft	—Unverified
Game-Theoretic Robust Reinforcement Learning Handles Temporally-Coupled Perturbations	Jul 22, 2023	continuous-controlContinuous Control	—Unverified
Bridging the Reality Gap of Reinforcement Learning based Traffic Signal Control using Domain Randomization and Meta Learning	Jul 21, 2023	Meta-LearningReinforcement Learning (RL)	—Unverified
Towards practical reinforcement learning for tokamak magnetic control	Jul 21, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reparameterized Policy Learning for Multimodal Trajectory Optimization	Jul 20, 2023	Reinforcement Learning (RL)	—Unverified
A reinforcement learning approach for VQA validation: an application to diabetic macular edema grading	Jul 19, 2023	Medical Image AnalysisQuestion Answering	—Unverified
Distributed 3D-Beam Reforming for Hovering-Tolerant UAVs Communication over Coexistence: A Deep-Q Learning for Intelligent Space-Air-Ground Integrated Networks	Jul 18, 2023	Q-LearningReinforcement Learning (RL)	—Unverified
Continuous-Time Reinforcement Learning: New Design Algorithms with Theoretical Insights and Performance Guarantees	Jul 18, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Data Cross-Segmentation for Improved Generalization in Reinforcement Learning Based Algorithmic Trading	Jul 18, 2023	Algorithmic Tradingreinforcement-learning	—Unverified
IxDRL: A Novel Explainable Deep Reinforcement Learning Toolkit based on Analyses of Interestingness	Jul 18, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Towards A Unified Agent with Foundation Models	Jul 18, 2023	Efficient ExplorationReinforcement Learning (RL)	—Unverified
REX: Rapid Exploration and eXploitation for AI Agents	Jul 18, 2023	AI AgentDecision Making	—Unverified
Quarl: A Learning-Based Quantum Circuit Optimizer	Jul 17, 2023	Reinforcement Learning (RL)	—Unverified
Basal-Bolus Advisor for Type 1 Diabetes (T1D) Patients Using Multi-Agent Reinforcement Learning (RL) Methodology	Jul 17, 2023	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
An Alternative to Variance: Gini Deviation for Risk-averse Policy Gradient	Jul 17, 2023	Reinforcement Learning (RL)	—Unverified
Discovering User Types: Mapping User Traits by Task-Specific Behaviors in Reinforcement Learning	Jul 16, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
POMDP inference and robust solution via deep reinforcement learning: An application to railway optimal maintenance	Jul 16, 2023	Decision MakingDeep Reinforcement Learning	CodeCode Available
Magnetic Field-Based Reward Shaping for Goal-Conditioned Reinforcement Learning	Jul 16, 2023	reinforcement-learningReinforcement Learning	—Unverified
Seeing is not Believing: Robust Reinforcement Learning against Spurious Correlation	Jul 15, 2023	reinforcement-learningReinforcement Learning	—Unverified
Efficient Action Robust Reinforcement Learning with Probabilistic Policy Execution Uncertainty	Jul 15, 2023	reinforcement-learningReinforcement Learning	—Unverified
An Empirical Study of the Effectiveness of Using a Replay Buffer on Mode Discovery in GFlowNets	Jul 15, 2023	Drug DiscoveryReinforcement Learning (RL)	—Unverified
Combining model-predictive control and predictive reinforcement learning for stable quadrupedal robot locomotion	Jul 15, 2023	Model Predictive Controlreinforcement-learning	—Unverified
Why Guided Dialog Policy Learning performs well? Understanding the role of adversarial learning and its alternative	Jul 13, 2023	Reinforcement Learning (RL)	—Unverified
Transformers in Reinforcement Learning: A Survey	Jul 12, 2023	Cloud ComputingCombinatorial Optimization	—Unverified
Learning Decentralized Partially Observable Mean Field Control for Artificial Collective Behavior	Jul 12, 2023	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 194 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified