Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6026–6050 of 15113 papers

Title	Date	Tasks	Status
Multi-trainer Interactive Reinforcement Learning System	Oct 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Output Feedback Adaptive Optimal Control of Affine Nonlinear systems with a Linear Measurement Model	Oct 13, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Offline Reinforcement Learning with Pessimism-Modulated Dynamics Belief	Oct 13, 2022	D4RLOffline RL	CodeCode Available
Personalized Federated Hypernetworks for Privacy Preservation in Multi-Task Reinforcement Learning	Oct 13, 2022	Federated LearningMulti-agent Reinforcement Learning	—Unverified
Object-Category Aware Reinforcement Learning	Oct 13, 2022	Feature EngineeringObject	—Unverified
Towards Multi-Agent Reinforcement Learning driven Over-The-Counter Market Simulations	Oct 13, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Reinforcement Learning with Unbiased Policy Evaluation and Linear Function Approximation	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Optimal Control of Material Micro-Structures	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Policy Gradient With Serial Markov Chain Reasoning	Oct 13, 2022	Decision MakingMuJoCo	—Unverified
Observed Adversaries in Deep Reinforcement Learning	Oct 13, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep reinforcement learning for automatic run-time adaptation of UWB PHY radio settings	Oct 13, 2022	Deep Reinforcement LearningIndoor Localization	—Unverified
Bootstrap Advantage Estimation for Policy Optimization in Reinforcement Learning	Oct 13, 2022	Data Augmentationreinforcement-learning	CodeCode Available
Dissipative residual layers for unsupervised implicit parameterization of data manifolds	Oct 13, 2022	DenoisingReinforcement Learning (RL)	—Unverified
Efficient circuit implementation for coined quantum walks on binary trees and application to reinforcement learning	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Concise Introduction to Reinforcement Learning in Robotics	Oct 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Causality-driven Hierarchical Structure Discovery for Reinforcement Learning	Oct 13, 2022	Hierarchical Reinforcement LearningMinecraft	—Unverified
Centralized Training with Hybrid Execution in Multi-Agent Reinforcement Learning	Oct 12, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Explaining Online Reinforcement Learning Decisions of Self-Adaptive Systems	Oct 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
DQLAP: Deep Q-Learning Recommender Algorithm with Update Policy for a Real Steam Turbine System	Oct 12, 2022	Deep LearningFault Detection	—Unverified
A Unified Framework for Alternating Offline Model Training and Policy Learning	Oct 12, 2022	continuous-controlContinuous Control	CodeCode Available
Smooth Trajectory Collision Avoidance through Deep Reinforcement Learning	Oct 12, 2022	Autonomous NavigationCollision Avoidance	—Unverified
Reinforcement Learning with Automated Auxiliary Loss Search	Oct 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Real World Offline Reinforcement Learning with Realistic Data Source	Oct 12, 2022	Imitation Learningreinforcement-learning	—Unverified
Regret Bounds for Risk-Sensitive Reinforcement Learning	Oct 11, 2022	reinforcement-learningReinforcement Learning	—Unverified
Multi-User Reinforcement Learning with Low Rank Rewards	Oct 11, 2022	Collaborative Filteringreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 242 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified