Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4001–4025 of 15113 papers

Title	Date	Tasks	Status
Learning Optimal Deterministic Policies with Stochastic Policy Gradients	May 3, 2024	Reinforcement Learning (RL)	—Unverified
Proximal Curriculum with Task Correlations for Deep Reinforcement Learning	May 3, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Tabular and Deep Reinforcement Learning for Gittins Index	May 2, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
FLAME: Factuality-Aware Alignment for Large Language Models	May 2, 2024	HallucinationInstruction Following	—Unverified
Constrained Reinforcement Learning Under Model Mismatch	May 2, 2024	modelreinforcement-learning	—Unverified
Learning Force Control for Legged Manipulation	May 2, 2024	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning for Edit-Based Non-Autoregressive Neural Machine Translation	May 2, 2024	Machine TranslationNMT	—Unverified
Plan-Seq-Learn: Language Model Guided RL for Solving Long Horizon Robotics Tasks	May 2, 2024	Language ModelingLanguage Modelling	—Unverified
Robust Risk-Sensitive Reinforcement Learning with Conditional Value-at-Risk	May 2, 2024	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning-Guided Semi-Supervised Learning	May 2, 2024	reinforcement-learningReinforcement Learning	—Unverified
Queue-based Eco-Driving at Roundabouts with Reinforcement Learning	May 1, 2024	reinforcement-learningReinforcement Learning	—Unverified
Navigating WebAI: Training Agents to Complete Web Tasks with Large Language Models and Reinforcement Learning	May 1, 2024	Language ModelingLanguage Modelling	—Unverified
Learning to Communicate Functional States with Nonverbal Expressions for Improved Human-Robot Collaboration	Apr 30, 2024	Reinforcement Learning (RL)	CodeCode Available
Countering Reward Over-optimization in LLM with Demonstration-Guided Reinforcement Learning	Apr 30, 2024	Reinforcement Learning (RL)Text Generation	CodeCode Available
Leveraging Sub-Optimal Data for Human-in-the-Loop Reinforcement Learning	Apr 30, 2024	Reinforcement Learning (RL)	—Unverified
Towards Generalist Robot Learning from Internet Video: A Survey	Apr 30, 2024	Natural Language UnderstandingReinforcement Learning (RL)	—Unverified
Sample-Efficient Robust Multi-Agent Reinforcement Learning in the Face of Environmental Uncertainty	Apr 29, 2024	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning Problem Solving with Large Language Models	Apr 29, 2024	Q-Learningreinforcement-learning	—Unverified
Towards Generalizable Agents in Text-Based Educational Environments: A Study of Integrating RL with LLMs	Apr 29, 2024	DiagnosticGeneral Knowledge	—Unverified
Control Policy Correction Framework for Reinforcement Learning-based Energy Arbitrage Strategies	Apr 29, 2024	Knowledge Distillationreinforcement-learning	—Unverified
Generalize by Touching: Tactile Ensemble Skill Transfer for Robotic Furniture Assembly	Apr 26, 2024	Contact-rich ManipulationOffline RL	—Unverified
EEG_RL-Net: Enhancing EEG MI Classification through Reinforcement Learning-Optimised Graph Neural Networks	Apr 26, 2024	ClassificationEEG	—Unverified
Knowledge Transfer for Cross-Domain Reinforcement Learning: A Systematic Review	Apr 26, 2024	Decision Makingreinforcement-learning	—Unverified
Enhancing Privacy and Security of Autonomous UAV Navigation	Apr 26, 2024	Autonomous NavigationDisaster Response	—Unverified
Offline Reinforcement Learning with Behavioral Supervisor Tuning	Apr 25, 2024	Offline RLreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 161 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified