Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4801–4850 of 15113 papers

Title	Date	Tasks	Status	Hype
SAFER: Safe Collision Avoidance using Focused and Efficient Trajectory Search with Reinforcement Learning	Sep 23, 2022	Collision Avoidancereinforcement-learning	—Unverified	0
On Efficient Reinforcement Learning for Full-length Game of StarCraft II	Sep 23, 2022	CPUreinforcement-learning	CodeCode Available	2
Quantification before Selection: Active Dynamics Preference for Robust Reinforcement Learning	Sep 23, 2022	Informativenessreinforcement-learning	—Unverified	0
Unified Algorithms for RL with Decision-Estimation Coefficients: PAC, Reward-Free, Preference-Based Learning, and Beyond	Sep 23, 2022	PAC learningReinforcement Learning (RL)	—Unverified	0
Minimizing Human Assistance: Augmenting a Single Demonstration for Deep Reinforcement Learning	Sep 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Pretraining the Vision Transformer using self-supervised methods for vision based Deep Reinforcement Learning	Sep 22, 2022	Atari GamesAtari Games 100k	CodeCode Available	0
Parallel Reinforcement Learning Simulation for Visual Quadrotor Navigation	Sep 22, 2022	Navigatereinforcement-learning	—Unverified	0
Reinforcement Learning in Computing and Network Convergence Orchestration	Sep 22, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Computational Discovery of Energy-Efficient Heat Treatment for Microstructure Design using Deep Reinforcement Learning	Sep 22, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Identifiability and generalizability from multiple experts in Inverse Reinforcement Learning	Sep 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
Developing, Evaluating and Scaling Learning Agents in Multi-Agent Environments	Sep 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
An Investigation of the Bias-Variance Tradeoff in Meta-Gradients	Sep 22, 2022	Meta-LearningReinforcement Learning (RL)	CodeCode Available	0
Hierarchical Decentralized Deep Reinforcement Learning Architecture for a Simulated Four-Legged Agent	Sep 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning from Symmetry: Meta-Reinforcement Learning with Symmetrical Behaviors and Language Instructions	Sep 21, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
ECSAS: Exploring Critical Scenarios from Action Sequence in Autonomous Driving	Sep 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
Evaluation of Look-ahead Economic Dispatch Using Reinforcement Learning	Sep 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
LCRL: Certified Policy Synthesis via Logically-Constrained Reinforcement Learning	Sep 21, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Lamarckian Platform: Pushing the Boundaries of Evolutionary Reinforcement Learning towards Asynchronous Commercial Games	Sep 21, 2022	CPUDistributed Computing	—Unverified	0
Hierarchical Decision Transformer	Sep 21, 2022	D4RLreinforcement-learning	—Unverified	0
Performance Optimization for Variable Bitwidth Federated Learning in Wireless Networks	Sep 21, 2022	Federated LearningModel-based Reinforcement Learning	—Unverified	0
Revisiting Discrete Soft Actor-Critic	Sep 21, 2022	Atari GamesQ-Learning	CodeCode Available	1
On the Convergence Theory of Meta Reinforcement Learning with Personalized Policies	Sep 21, 2022	continuous-controlContinuous Control	—Unverified	0
Model-Free Reinforcement Learning for Asset Allocation	Sep 21, 2022	Managementmodel	—Unverified	0
Towards Task-Prioritized Policy Composition	Sep 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Optimizing Crop Management with Reinforcement Learning and Imitation Learning	Sep 20, 2022	Imitation LearningManagement	—Unverified	0
Soft Action Priors: Towards Robust Policy Transfer	Sep 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Locally Constrained Representations in Reinforcement Learning	Sep 20, 2022	continuous-controlContinuous Control	—Unverified	0
Macro-Action-Based Multi-Agent/Robot Deep Reinforcement Learning under Partial Observability	Sep 20, 2022	Decision MakingDecision Making Under Uncertainty	—Unverified	0
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Graph Value Iteration	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Q-Network for AI Soccer	Sep 20, 2022	Atari Gamesreinforcement-learning	—Unverified	0
IRS Assisted NOMA Aided Mobile Edge Computing with Queue Stability: Heterogeneous Multi-Agent Reinforcement Learning	Sep 20, 2022	Edge-computingMulti-agent Reinforcement Learning	—Unverified	0
A Spiking Neural Network Learning Markov Chain	Sep 20, 2022	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Joint Imitation-Reinforcement Learning Framework for Reduced Baseline Regret	Sep 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Deep Reinforcement Learning-Based Charging Scheduling Approach with Augmented Lagrangian for Electric Vehicle	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Transferring Knowledge for Reinforcement Learning in Contact-Rich Manipulation	Sep 19, 2022	Contact-rich Manipulationreinforcement-learning	—Unverified	0
Meta-Reinforcement Learning for Adaptive Control of Second Order Systems	Sep 19, 2022	Meta-LearningMeta Reinforcement Learning	—Unverified	0
MAN: Multi-Action Networks Learning	Sep 19, 2022	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Safe reinforcement learning control for continuous-time nonlinear systems without a backup controller	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning	Sep 19, 2022	Atari GamesBenchmarking	—Unverified	0
Measuring Interventional Robustness in Reinforcement Learning	Sep 19, 2022	Fairnessreinforcement-learning	CodeCode Available	0
MSVIPER: Improved Policy Distillation for Reinforcement-Learning-Based Robot Navigation	Sep 19, 2022	Imitation Learningreinforcement-learning	—Unverified	0
BOME! Bilevel Optimization Made Easy: A Simple First-Order Approach	Sep 19, 2022	Bilevel OptimizationContinual Learning	CodeCode Available	1
Age of Semantics in Cooperative Communications: To Expedite Simulation Towards Real via Offline Reinforcement Learning	Sep 19, 2022	Reinforcement Learning (RL)	—Unverified	0
Enforcing the consensus between Trajectory Optimization and Policy Learning for precise robot control	Sep 19, 2022	Reinforcement Learning (RL)valid	—Unverified	0
A Transferable and Automatic Tuning of Deep Reinforcement Learning for Cost Effective Phishing Detection	Sep 19, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Active Predicting Coding: Brain-Inspired Reinforcement Learning for Sparse Reward Robotic Control Problems	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in Dynamic Environments	Sep 19, 2022	Decision MakingImitation Learning	CodeCode Available	1
"Guess what I'm doing": Extending legibility to sequential decision tasks	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Latent Plans for Task-Agnostic Offline Reinforcement Learning	Sep 19, 2022	Imitation Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 97 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified