Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6276–6300 of 15113 papers

Title	Date	Tasks	Status
A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a Platform	Sep 7, 2022	Deep Reinforcement LearningOpenAI Gym	—Unverified
Concept-modulated model-based offline reinforcement learning for rapid generalization	Sep 7, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
A SUMO Framework for Deep Reinforcement Learning Experiments Solving Electric Vehicle Charging Dispatching Problem	Sep 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Energy Optimization of Wind Turbines via a Neural Control Policy Based on Reinforcement Learning Markov Chain Monte Carlo Algorithm	Sep 7, 2022	Point TrackingReinforcement Learning (RL)	—Unverified
Distilling Deep RL Models Into Interpretable Neuro-Fuzzy Systems	Sep 7, 2022	Deep Reinforcement LearningOpenAI Gym	—Unverified
On the Near-Optimality of Local Policies in Large Cooperative Multi-Agent Reinforcement Learning	Sep 7, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Project proposal: A modular reinforcement learning based automated theorem prover	Sep 6, 2022	OpenAI Gymreinforcement-learning	CodeCode Available
Annealing Optimization for Progressive Learning with Stochastic Approximation	Sep 6, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Finite-Time Error Bounds for Greedy-GQ	Sep 6, 2022	reinforcement-learningReinforcement Learning	—Unverified
Improving Assistive Robotics with Deep Reinforcement Learning	Sep 5, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement learning-based optimised control for tracking of nonlinear systems with adversarial attacks	Sep 5, 2022	reinforcement-learningReinforcement Learning	—Unverified
Red Teaming with Mind Reading: White-Box Adversarial Policies Against RL Agents	Sep 5, 2022	Red Teamingreinforcement-learning	CodeCode Available
SlateFree: a Model-Free Decomposition for Reinforcement Learning with Slate Actions	Sep 5, 2022	Q-Learningreinforcement-learning	—Unverified
Natural Policy Gradients In Reinforcement Learning Explained	Sep 5, 2022	Policy Gradient Methodsreinforcement-learning	—Unverified
Prediction Based Decision Making for Autonomous Highway Driving	Sep 5, 2022	Autonomous DrivingDecision Making	—Unverified
Variational Inference for Model-Free and Model-Based Reinforcement Learning	Sep 4, 2022	Bayesian InferenceBayesian Optimization	—Unverified
Model-Free Deep Reinforcement Learning in Software-Defined Networks	Sep 3, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Statistical CSI-based Beamforming for RIS-Aided Multiuser MISO Systems using Deep Reinforcement Learning	Sep 3, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
TarGF: Learning Target Gradient Field to Rearrange Objects without Explicit Goal Specification	Sep 2, 2022	Imitation LearningObject	—Unverified
Taming Multi-Agent Reinforcement Learning with Estimator Variance Reduction	Sep 2, 2022	MuJoCoMulti-agent Reinforcement Learning	—Unverified
Learning Practical Communication Strategies in Cooperative Multi-Agent Reinforcement Learning	Sep 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Dialogue Evaluation with Offline Reinforcement Learning	Sep 2, 2022	Dialogue EvaluationOffline RL	—Unverified
A Technique to Create Weaker Abstract Board Game Agents via Reinforcement Learning	Sep 1, 2022	Board GamesQ-Learning	—Unverified
Dynamics-Adaptive Continual Reinforcement Learning via Progressive Contextualization	Sep 1, 2022	Bayesian InferenceKnowledge Distillation	—Unverified
Deep reinforcement learning for quantum multiparameter estimation	Sep 1, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 252 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified