Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6251–6275 of 15113 papers

Title	Date	Tasks	Status
Data efficient reinforcement learning and adaptive optimal perimeter control of network traffic dynamics	Sep 13, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Skip Training for Multi-Agent Reinforcement Learning Controller for Industrial Wave Energy Converters	Sep 13, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Unifying Causal Inference and Reinforcement Learning using Higher-Order Category Theory	Sep 13, 2022	Causal Inferencereinforcement-learning	—Unverified
Unified State Representation Learning under Data Augmentation	Sep 12, 2022	Data AugmentationDomain Adaptation	CodeCode Available
Self-supervised Sequential Information Bottleneck for Robust Exploration in Deep Reinforcement Learning	Sep 12, 2022	Deep Reinforcement LearningEfficient Exploration	—Unverified
Deterministic Sequencing of Exploration and Exploitation for Reinforcement Learning	Sep 12, 2022	Efficient Explorationreinforcement-learning	—Unverified
Checklist Models for Improved Output Fluency in Piano Fingering Prediction	Sep 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Pathfinding in Random Partially Observable Environments with Vision-Informed Deep Reinforcement Learning	Sep 11, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Performance-Driven Controller Tuning via Derivative-Free Reinforcement Learning	Sep 11, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Safe Reinforcement Learning with Contrastive Risk Prediction	Sep 10, 2022	Predictionreinforcement-learning	—Unverified
Ask Before You Act: Generalising to Novel Environments by Asking Questions	Sep 10, 2022	Reinforcement Learning (RL)	CodeCode Available
Cooperation and Competition: Flocking with Evolutionary Multi-Agent Reinforcement Learning	Sep 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Task-Agnostic Learning to Accomplish New Tasks	Sep 9, 2022	Imitation LearningOffline RL	—Unverified
An Analysis of Deep Reinforcement Learning Agents for Text-based Games	Sep 9, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
RASR: Risk-Averse Soft-Robust MDPs with EVaR and Entropic Risk	Sep 9, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Robust Policy Optimization in Continuous-time Mixed H_2/H_ Stochastic Control	Sep 9, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reward Delay Attacks on Deep Reinforcement Learning	Sep 8, 2022	Deep Reinforcement LearningQ-Learning	CodeCode Available
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL	Sep 8, 2022	D4RLOffline RL	—Unverified
Non-iterative generation of an optimal mesh for a blade passage using deep reinforcement learning	Sep 8, 2022	Computational EfficiencyDeep Reinforcement Learning	—Unverified
Hybrid Supervised and Reinforcement Learning for the Design and Optimization of Nanophotonic Structures	Sep 8, 2022	Computational Efficiencyreinforcement-learning	—Unverified
Adaptive Combination of a Genetic Algorithm and Novelty Search for Deep Neuroevolution	Sep 8, 2022	DiversityReinforcement Learning (RL)	CodeCode Available
A Survey on Large-Population Systems and Scalable Multi-Agent Reinforcement Learning	Sep 8, 2022	Decision MakingEpidemiology	—Unverified
An Empirical Evaluation of Posterior Sampling for Constrained Reinforcement Learning	Sep 8, 2022	Efficient Explorationreinforcement-learning	CodeCode Available
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available
DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in Complex Environments	Sep 7, 2022	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 251 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified