Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6151–6200 of 15113 papers

Title	Date	Tasks	Status
Argumentative Reward Learning: Reasoning About Human Preferences	Sep 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
Design of experiments for the calibration of history-dependent models via deep reinforcement learning and an enhanced Kalman filter	Sep 27, 2022	Deep Reinforcement LearningExperimental Design	—Unverified
DCE: Offline Reinforcement Learning With Double Conservative Estimates	Sep 27, 2022	Computational EfficiencyD4RL	—Unverified
Neural Frank-Wolfe Policy Optimization for Region-of-Interest Intra-Frame Coding with HEVC/H.265	Sep 27, 2022	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning with Non-Exponential Discounting	Sep 27, 2022	Decision MakingModel-based Reinforcement Learning	—Unverified
Safe Reinforcement Learning of Dynamic High-Dimensional Robotic Tasks: Navigation, Manipulation, Interaction	Sep 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Cognitive Delay/Disruption Tolerant Network Node Management in an LEO-based Satellite Constellation	Sep 27, 2022	ManagementReinforcement Learning (RL)	—Unverified
Paused Agent Replay Refresh	Sep 26, 2022	Montezuma's Revengereinforcement-learning	—Unverified
Overcoming Referential Ambiguity in Language-Guided Goal-Conditioned Reinforcement Learning	Sep 26, 2022	Objectreinforcement-learning	—Unverified
Understanding Hindsight Goal Relabeling from a Divergence Minimization Perspective	Sep 26, 2022	Imitation LearningMulti-Goal Reinforcement Learning	—Unverified
DEFT: Diverse Ensembles for Fast Transfer in Reinforcement Learning	Sep 26, 2022	Ensemble Learningreinforcement-learning	—Unverified
Actor-Critic Network for O-RAN Resource Allocation: xApp Design, Deployment, and Analysis	Sep 26, 2022	Reinforcement Learning (RL)	—Unverified
Improving Document Image Understanding with Reinforcement Finetuning	Sep 26, 2022	Reinforcement Learning (RL)	—Unverified
Delayed Geometric Discounts: An Alternative Criterion for Reinforcement Learning	Sep 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Adaptive Mesh Refinement	Sep 25, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Unsupervised Reward Shaping for a Robotic Sequential Picking Task from Visual Observations in a Logistics Scenario	Sep 25, 2022	Imitation LearningReinforcement Learning (RL)	CodeCode Available
Opportunities and Challenges from Using Animal Videos in Reinforcement Learning for Navigation	Sep 25, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reward Learning using Structural Motifs in Inverse Reinforcement Learning	Sep 25, 2022	reinforcement-learningReinforcement Learning	—Unverified
Explainable Reinforcement Learning via Model Transforms	Sep 24, 2022	Decision Makingmodel	CodeCode Available
Fast Lifelong Adaptive Inverse Reinforcement Learning from Demonstrations	Sep 24, 2022	Continuous Controlreinforcement-learning	—Unverified
Unified Algorithms for RL with Decision-Estimation Coefficients: PAC, Reward-Free, Preference-Based Learning, and Beyond	Sep 23, 2022	PAC learningReinforcement Learning (RL)	—Unverified
SAFER: Safe Collision Avoidance using Focused and Efficient Trajectory Search with Reinforcement Learning	Sep 23, 2022	Collision Avoidancereinforcement-learning	—Unverified
Quantification before Selection: Active Dynamics Preference for Robust Reinforcement Learning	Sep 23, 2022	Informativenessreinforcement-learning	—Unverified
Minimizing Human Assistance: Augmenting a Single Demonstration for Deep Reinforcement Learning	Sep 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning in Computing and Network Convergence Orchestration	Sep 22, 2022	reinforcement-learningReinforcement Learning	—Unverified
Pretraining the Vision Transformer using self-supervised methods for vision based Deep Reinforcement Learning	Sep 22, 2022	Atari GamesAtari Games 100k	CodeCode Available
Parallel Reinforcement Learning Simulation for Visual Quadrotor Navigation	Sep 22, 2022	Navigatereinforcement-learning	—Unverified
Developing, Evaluating and Scaling Learning Agents in Multi-Agent Environments	Sep 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
An Investigation of the Bias-Variance Tradeoff in Meta-Gradients	Sep 22, 2022	Meta-LearningReinforcement Learning (RL)	CodeCode Available
Identifiability and generalizability from multiple experts in Inverse Reinforcement Learning	Sep 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Computational Discovery of Energy-Efficient Heat Treatment for Microstructure Design using Deep Reinforcement Learning	Sep 22, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning from Symmetry: Meta-Reinforcement Learning with Symmetrical Behaviors and Language Instructions	Sep 21, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified
Lamarckian Platform: Pushing the Boundaries of Evolutionary Reinforcement Learning towards Asynchronous Commercial Games	Sep 21, 2022	CPUDistributed Computing	—Unverified
ECSAS: Exploring Critical Scenarios from Action Sequence in Autonomous Driving	Sep 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Hierarchical Decision Transformer	Sep 21, 2022	D4RLreinforcement-learning	—Unverified
Evaluation of Look-ahead Economic Dispatch Using Reinforcement Learning	Sep 21, 2022	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical Decentralized Deep Reinforcement Learning Architecture for a Simulated Four-Legged Agent	Sep 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Model-Free Reinforcement Learning for Asset Allocation	Sep 21, 2022	Managementmodel	—Unverified
On the Convergence Theory of Meta Reinforcement Learning with Personalized Policies	Sep 21, 2022	continuous-controlContinuous Control	—Unverified
Performance Optimization for Variable Bitwidth Federated Learning in Wireless Networks	Sep 21, 2022	Federated LearningModel-based Reinforcement Learning	—Unverified
Towards Task-Prioritized Policy Composition	Sep 20, 2022	reinforcement-learningReinforcement Learning	—Unverified
Optimizing Crop Management with Reinforcement Learning and Imitation Learning	Sep 20, 2022	Imitation LearningManagement	—Unverified
Soft Action Priors: Towards Robust Policy Transfer	Sep 20, 2022	reinforcement-learningReinforcement Learning	—Unverified
Macro-Action-Based Multi-Agent/Robot Deep Reinforcement Learning under Partial Observability	Sep 20, 2022	Decision MakingDecision Making Under Uncertainty	—Unverified
A Joint Imitation-Reinforcement Learning Framework for Reduced Baseline Regret	Sep 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
IRS Assisted NOMA Aided Mobile Edge Computing with Queue Stability: Heterogeneous Multi-Agent Reinforcement Learning	Sep 20, 2022	Edge-computingMulti-agent Reinforcement Learning	—Unverified
Deep Q-Network for AI Soccer	Sep 20, 2022	Atari Gamesreinforcement-learning	—Unverified
A Spiking Neural Network Learning Markov Chain	Sep 20, 2022	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Locally Constrained Representations in Reinforcement Learning	Sep 20, 2022	continuous-controlContinuous Control	—Unverified
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 124 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified