Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4801–4825 of 15113 papers

Title	Date	Tasks	Status	Hype
SAFER: Safe Collision Avoidance using Focused and Efficient Trajectory Search with Reinforcement Learning	Sep 23, 2022	Collision Avoidancereinforcement-learning	—Unverified	0
On Efficient Reinforcement Learning for Full-length Game of StarCraft II	Sep 23, 2022	CPUreinforcement-learning	CodeCode Available	2
Quantification before Selection: Active Dynamics Preference for Robust Reinforcement Learning	Sep 23, 2022	Informativenessreinforcement-learning	—Unverified	0
Unified Algorithms for RL with Decision-Estimation Coefficients: PAC, Reward-Free, Preference-Based Learning, and Beyond	Sep 23, 2022	PAC learningReinforcement Learning (RL)	—Unverified	0
Minimizing Human Assistance: Augmenting a Single Demonstration for Deep Reinforcement Learning	Sep 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Pretraining the Vision Transformer using self-supervised methods for vision based Deep Reinforcement Learning	Sep 22, 2022	Atari GamesAtari Games 100k	CodeCode Available	0
Parallel Reinforcement Learning Simulation for Visual Quadrotor Navigation	Sep 22, 2022	Navigatereinforcement-learning	—Unverified	0
Reinforcement Learning in Computing and Network Convergence Orchestration	Sep 22, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Computational Discovery of Energy-Efficient Heat Treatment for Microstructure Design using Deep Reinforcement Learning	Sep 22, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Identifiability and generalizability from multiple experts in Inverse Reinforcement Learning	Sep 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
Developing, Evaluating and Scaling Learning Agents in Multi-Agent Environments	Sep 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
An Investigation of the Bias-Variance Tradeoff in Meta-Gradients	Sep 22, 2022	Meta-LearningReinforcement Learning (RL)	CodeCode Available	0
Hierarchical Decentralized Deep Reinforcement Learning Architecture for a Simulated Four-Legged Agent	Sep 21, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning from Symmetry: Meta-Reinforcement Learning with Symmetrical Behaviors and Language Instructions	Sep 21, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
ECSAS: Exploring Critical Scenarios from Action Sequence in Autonomous Driving	Sep 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
Evaluation of Look-ahead Economic Dispatch Using Reinforcement Learning	Sep 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
LCRL: Certified Policy Synthesis via Logically-Constrained Reinforcement Learning	Sep 21, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Lamarckian Platform: Pushing the Boundaries of Evolutionary Reinforcement Learning towards Asynchronous Commercial Games	Sep 21, 2022	CPUDistributed Computing	—Unverified	0
Hierarchical Decision Transformer	Sep 21, 2022	D4RLreinforcement-learning	—Unverified	0
Performance Optimization for Variable Bitwidth Federated Learning in Wireless Networks	Sep 21, 2022	Federated LearningModel-based Reinforcement Learning	—Unverified	0
Revisiting Discrete Soft Actor-Critic	Sep 21, 2022	Atari GamesQ-Learning	CodeCode Available	1
On the Convergence Theory of Meta Reinforcement Learning with Personalized Policies	Sep 21, 2022	continuous-controlContinuous Control	—Unverified	0
Model-Free Reinforcement Learning for Asset Allocation	Sep 21, 2022	Managementmodel	—Unverified	0
Towards Task-Prioritized Policy Composition	Sep 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Optimizing Crop Management with Reinforcement Learning and Imitation Learning	Sep 20, 2022	Imitation LearningManagement	—Unverified	0

Show:10 25 50

← PrevPage 193 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified