Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4926–4950 of 15113 papers

Title	Date	Tasks	Status
A Scalable Reinforcement Learning Approach for Attack Allocation in Swarm to Swarm Engagement Problems	Oct 15, 2022	Reinforcement Learning (RL)	—Unverified
A Scalable Reinforcement Learning-based System Using On-Chain Data for Cryptocurrency Portfolio Management	Jul 4, 2023	ManagementReinforcement Learning (RL)	—Unverified
A Scale-Independent Multi-Objective Reinforcement Learning with Convergence Analysis	Feb 8, 2023	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown Dynamical Systems under Attacks	Feb 1, 2021	Misinformationreinforcement-learning	—Unverified
A Sensorimotor Reinforcement Learning Framework for Physical Human-Robot Interaction	Jul 27, 2016	Bayesian OptimizationGaussian Processes	—Unverified
A storage expansion planning framework using reinforcement learning and simulation-based optimization	Jan 10, 2020	Decision MakingQ-Learning	—Unverified
ASHA: Assistive Teleoperation via Human-in-the-Loop Reinforcement Learning	Feb 5, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Sharp Analysis of Model-based Reinforcement Learning with Self-Play	Oct 4, 2020	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
A Complete Characterization of Linear Estimators for Offline Policy Evaluation	Mar 8, 2022	Decision Makingreinforcement-learning	—Unverified
A Short Note on Soft-max and Policy Gradients in Bandits Problems	Jul 20, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Short Note on the Relationship of Information Gain and Eluder Dimension	Jul 6, 2021	LEMMAreinforcement-learning	—Unverified
A Short Survey On Memory Based Reinforcement Learning	Apr 14, 2019	Decision Makingreinforcement-learning	—Unverified
A Short Survey on Probabilistic Reinforcement Learning	Jan 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
A short variational proof of equivalence between policy gradients and soft Q learning	Dec 22, 2017	Q-Learningreinforcement-learning	—Unverified
A Shoulder to Cry on: Towards A Motivational Virtual Assistant for Assuaging Mental Agony	Jul 1, 2022	Dialogue GenerationReinforcement Learning (RL)	—Unverified
A Signaling Game Approach to Databases Querying and Interaction	Mar 13, 2016	Data InteractionManagement	—Unverified
A Simple Imitation Learning Method via Contrastive Regularization	May 16, 2020	Atari GamesImitation Learning	—Unverified
A Simple Reinforcement Learning Mechanism for Resource Allocation in LTE-A Networks with Markov Decision Process and Q-Learning	Sep 27, 2017	Q-Learningreinforcement-learning	—Unverified
A Simple Reward-free Approach to Constrained Reinforcement Learning	Jul 12, 2021	Diversityreinforcement-learning	—Unverified
A Simple Sparse Denoising Layer for Robust Deep Learning	Jan 1, 2021	Deep LearningDenoising	—Unverified
A Distance-based Anomaly Detection Framework for Deep Reinforcement Learning	Sep 21, 2021	Anomaly DetectionAtari Games	—Unverified
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning	Jun 13, 2023	D4RLEfficient Exploration	—Unverified
Novelty Detection in Reinforcement Learning with World Models	Oct 12, 2023	Decision MakingNovelty Detection	—Unverified
A Single-Timescale Analysis For Stochastic Approximation With Multiple Coupled Sequences	Jun 21, 2022	Reinforcement Learning (RL)	—Unverified
Ask1: Development and Reinforcement Learning-Based Control of a Custom Quadruped Robot	Dec 11, 2024	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 198 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified