Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6251–6300 of 15113 papers

Title	Date	Tasks	Status
Data efficient reinforcement learning and adaptive optimal perimeter control of network traffic dynamics	Sep 13, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Skip Training for Multi-Agent Reinforcement Learning Controller for Industrial Wave Energy Converters	Sep 13, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Unifying Causal Inference and Reinforcement Learning using Higher-Order Category Theory	Sep 13, 2022	Causal Inferencereinforcement-learning	—Unverified
Unified State Representation Learning under Data Augmentation	Sep 12, 2022	Data AugmentationDomain Adaptation	CodeCode Available
Self-supervised Sequential Information Bottleneck for Robust Exploration in Deep Reinforcement Learning	Sep 12, 2022	Deep Reinforcement LearningEfficient Exploration	—Unverified
Deterministic Sequencing of Exploration and Exploitation for Reinforcement Learning	Sep 12, 2022	Efficient Explorationreinforcement-learning	—Unverified
Checklist Models for Improved Output Fluency in Piano Fingering Prediction	Sep 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Pathfinding in Random Partially Observable Environments with Vision-Informed Deep Reinforcement Learning	Sep 11, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Performance-Driven Controller Tuning via Derivative-Free Reinforcement Learning	Sep 11, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Safe Reinforcement Learning with Contrastive Risk Prediction	Sep 10, 2022	Predictionreinforcement-learning	—Unverified
Ask Before You Act: Generalising to Novel Environments by Asking Questions	Sep 10, 2022	Reinforcement Learning (RL)	CodeCode Available
Cooperation and Competition: Flocking with Evolutionary Multi-Agent Reinforcement Learning	Sep 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Task-Agnostic Learning to Accomplish New Tasks	Sep 9, 2022	Imitation LearningOffline RL	—Unverified
An Analysis of Deep Reinforcement Learning Agents for Text-based Games	Sep 9, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
RASR: Risk-Averse Soft-Robust MDPs with EVaR and Entropic Risk	Sep 9, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified
Robust Policy Optimization in Continuous-time Mixed H_2/H_ Stochastic Control	Sep 9, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reward Delay Attacks on Deep Reinforcement Learning	Sep 8, 2022	Deep Reinforcement LearningQ-Learning	CodeCode Available
Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RL	Sep 8, 2022	D4RLOffline RL	—Unverified
Non-iterative generation of an optimal mesh for a blade passage using deep reinforcement learning	Sep 8, 2022	Computational EfficiencyDeep Reinforcement Learning	—Unverified
Hybrid Supervised and Reinforcement Learning for the Design and Optimization of Nanophotonic Structures	Sep 8, 2022	Computational Efficiencyreinforcement-learning	—Unverified
Adaptive Combination of a Genetic Algorithm and Novelty Search for Deep Neuroevolution	Sep 8, 2022	DiversityReinforcement Learning (RL)	CodeCode Available
A Survey on Large-Population Systems and Scalable Multi-Agent Reinforcement Learning	Sep 8, 2022	Decision MakingEpidemiology	—Unverified
An Empirical Evaluation of Posterior Sampling for Constrained Reinforcement Learning	Sep 8, 2022	Efficient Explorationreinforcement-learning	CodeCode Available
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available
DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in Complex Environments	Sep 7, 2022	Reinforcement Learning (RL)	—Unverified
A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a Platform	Sep 7, 2022	Deep Reinforcement LearningOpenAI Gym	—Unverified
Concept-modulated model-based offline reinforcement learning for rapid generalization	Sep 7, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
A SUMO Framework for Deep Reinforcement Learning Experiments Solving Electric Vehicle Charging Dispatching Problem	Sep 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Energy Optimization of Wind Turbines via a Neural Control Policy Based on Reinforcement Learning Markov Chain Monte Carlo Algorithm	Sep 7, 2022	Point TrackingReinforcement Learning (RL)	—Unverified
Distilling Deep RL Models Into Interpretable Neuro-Fuzzy Systems	Sep 7, 2022	Deep Reinforcement LearningOpenAI Gym	—Unverified
On the Near-Optimality of Local Policies in Large Cooperative Multi-Agent Reinforcement Learning	Sep 7, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Project proposal: A modular reinforcement learning based automated theorem prover	Sep 6, 2022	OpenAI Gymreinforcement-learning	CodeCode Available
Annealing Optimization for Progressive Learning with Stochastic Approximation	Sep 6, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Finite-Time Error Bounds for Greedy-GQ	Sep 6, 2022	reinforcement-learningReinforcement Learning	—Unverified
Improving Assistive Robotics with Deep Reinforcement Learning	Sep 5, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement learning-based optimised control for tracking of nonlinear systems with adversarial attacks	Sep 5, 2022	reinforcement-learningReinforcement Learning	—Unverified
Red Teaming with Mind Reading: White-Box Adversarial Policies Against RL Agents	Sep 5, 2022	Red Teamingreinforcement-learning	CodeCode Available
SlateFree: a Model-Free Decomposition for Reinforcement Learning with Slate Actions	Sep 5, 2022	Q-Learningreinforcement-learning	—Unverified
Natural Policy Gradients In Reinforcement Learning Explained	Sep 5, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified
Prediction Based Decision Making for Autonomous Highway Driving	Sep 5, 2022	Autonomous DrivingDecision Making	—Unverified
Variational Inference for Model-Free and Model-Based Reinforcement Learning	Sep 4, 2022	Bayesian InferenceBayesian Optimization	—Unverified
Model-Free Deep Reinforcement Learning in Software-Defined Networks	Sep 3, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Statistical CSI-based Beamforming for RIS-Aided Multiuser MISO Systems using Deep Reinforcement Learning	Sep 3, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
TarGF: Learning Target Gradient Field to Rearrange Objects without Explicit Goal Specification	Sep 2, 2022	Imitation LearningObject	—Unverified
Taming Multi-Agent Reinforcement Learning with Estimator Variance Reduction	Sep 2, 2022	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Learning Practical Communication Strategies in Cooperative Multi-Agent Reinforcement Learning	Sep 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified
A Technique to Create Weaker Abstract Board Game Agents via Reinforcement Learning	Sep 1, 2022	Board GamesQ-Learning	—Unverified
Dynamics-Adaptive Continual Reinforcement Learning via Progressive Contextualization	Sep 1, 2022	Bayesian InferenceKnowledge Distillation	—Unverified
Deep reinforcement learning for quantum multiparameter estimation	Sep 1, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 126 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified