Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6001–6050 of 15113 papers

Title	Date	Tasks	Status
RPM: Generalizable Behaviors for Multi-Agent Reinforcement Learning	Oct 18, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
You Only Live Once: Single-Life Reinforcement Learning	Oct 17, 2022	continuous-controlContinuous Control	—Unverified
Model Predictive Control via On-Policy Imitation Learning	Oct 17, 2022	Imitation Learningmodel	—Unverified
PTDE: Personalized Training with Distilled Execution for Multi-Agent Reinforcement Learning	Oct 17, 2022	Learning-To-RankMulti-agent Reinforcement Learning	—Unverified
A Generative User Simulator with GPT-based Architecture and Goal State Tracking for Reinforced Multi-Domain Dialog Systems	Oct 17, 2022	Reinforcement Learning (RL)	CodeCode Available
Boosting Offline Reinforcement Learning via Data Rebalancing	Oct 17, 2022	D4RLOffline RL	—Unverified
Entropy Regularized Reinforcement Learning with Cascading Networks	Oct 16, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data	Oct 16, 2022	Model SelectionOffline RL	—Unverified
The Impact of Task Underspecification in Evaluating Deep Reinforcement Learning	Oct 16, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Towards an Interpretable Hierarchical Agent Framework using Semantic Goals	Oct 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Near-Optimal Regret Bounds for Multi-batch Reinforcement Learning	Oct 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Revisiting the Roles of "Text" in Text Games	Oct 15, 2022	Natural Language UnderstandingPassage Retrieval	—Unverified
PI-QT-Opt: Predictive Information Improves Multi-Task Robotic Reinforcement Learning at Scale	Oct 15, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for ConnectX	Oct 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
DyFEn: Agent-Based Fee Setting in Payment Channel Networks	Oct 15, 2022	BenchmarkingDeep Reinforcement Learning	—Unverified
A Scalable Reinforcement Learning Approach for Attack Allocation in Swarm to Swarm Engagement Problems	Oct 15, 2022	Reinforcement Learning (RL)	—Unverified
A Multilevel Reinforcement Learning Framework for PDE-based Control	Oct 15, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
G-PECNet: Towards a Generalizable Pedestrian Trajectory Prediction System	Oct 15, 2022	Autonomous VehiclesData Augmentation	CodeCode Available
Query Rewriting for Effective Misinformation Discovery	Oct 14, 2022	Misinformationreinforcement-learning	—Unverified
Distributional Reward Estimation for Effective Multi-Agent Deep Reinforcement Learning	Oct 14, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
A Scalable Finite Difference Method for Deep Reinforcement Learning	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive patch foraging in deep reinforcement learning agents	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Just Round: Quantized Observation Spaces Enable Memory Efficient Learning of Dynamic Locomotion	Oct 14, 2022	Deep Reinforcement LearningQuantization	CodeCode Available
A Reinforcement Learning Approach to Estimating Long-term Treatment Effects	Oct 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Robust Preference Learning for Storytelling via Contrastive Reinforcement Learning	Oct 14, 2022	Contrastive LearningLanguage Modeling	—Unverified
Multi-trainer Interactive Reinforcement Learning System	Oct 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Output Feedback Adaptive Optimal Control of Affine Nonlinear systems with a Linear Measurement Model	Oct 13, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Offline Reinforcement Learning with Pessimism-Modulated Dynamics Belief	Oct 13, 2022	D4RLOffline RL	CodeCode Available
Personalized Federated Hypernetworks for Privacy Preservation in Multi-Task Reinforcement Learning	Oct 13, 2022	Federated LearningMulti-agent Reinforcement Learning	—Unverified
Object-Category Aware Reinforcement Learning	Oct 13, 2022	Feature EngineeringObject	—Unverified
Towards Multi-Agent Reinforcement Learning driven Over-The-Counter Market Simulations	Oct 13, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Reinforcement Learning with Unbiased Policy Evaluation and Linear Function Approximation	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Optimal Control of Material Micro-Structures	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Policy Gradient With Serial Markov Chain Reasoning	Oct 13, 2022	Decision MakingMuJoCo	—Unverified
Observed Adversaries in Deep Reinforcement Learning	Oct 13, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep reinforcement learning for automatic run-time adaptation of UWB PHY radio settings	Oct 13, 2022	Deep Reinforcement LearningIndoor Localization	—Unverified
Bootstrap Advantage Estimation for Policy Optimization in Reinforcement Learning	Oct 13, 2022	Data Augmentationreinforcement-learning	CodeCode Available
Dissipative residual layers for unsupervised implicit parameterization of data manifolds	Oct 13, 2022	DenoisingReinforcement Learning (RL)	—Unverified
Efficient circuit implementation for coined quantum walks on binary trees and application to reinforcement learning	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Concise Introduction to Reinforcement Learning in Robotics	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Causality-driven Hierarchical Structure Discovery for Reinforcement Learning	Oct 13, 2022	Hierarchical Reinforcement LearningMinecraft	—Unverified
Centralized Training with Hybrid Execution in Multi-Agent Reinforcement Learning	Oct 12, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Explaining Online Reinforcement Learning Decisions of Self-Adaptive Systems	Oct 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
DQLAP: Deep Q-Learning Recommender Algorithm with Update Policy for a Real Steam Turbine System	Oct 12, 2022	Deep LearningFault Detection	—Unverified
A Unified Framework for Alternating Offline Model Training and Policy Learning	Oct 12, 2022	continuous-controlContinuous Control	CodeCode Available
Smooth Trajectory Collision Avoidance through Deep Reinforcement Learning	Oct 12, 2022	Autonomous NavigationCollision Avoidance	—Unverified
Reinforcement Learning with Automated Auxiliary Loss Search	Oct 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Real World Offline Reinforcement Learning with Realistic Data Source	Oct 12, 2022	Imitation Learningreinforcement-learning	—Unverified
Regret Bounds for Risk-Sensitive Reinforcement Learning	Oct 11, 2022	reinforcement-learningReinforcement Learning	—Unverified
Multi-User Reinforcement Learning with Low Rank Rewards	Oct 11, 2022	Collaborative Filteringreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 121 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified