Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3501–3525 of 15113 papers

Title	Date	Tasks	Status	Hype
DREAM: Adaptive Reinforcement Learning based on Attention Mechanism for Temporal Knowledge Graph Reasoning	Apr 8, 2023	Knowledge GraphsMissing Elements	—Unverified	0
Evolving Reinforcement Learning Environment to Minimize Learner's Achievable Reward: An Application on Hardening Active Directory Systems	Apr 8, 2023	DiversityManagement	—Unverified	0
Efficient bimanual handover and rearrangement via symmetry-aware actor-critic learning	Apr 7, 2023	Reinforcement Learning (RL)	CodeCode Available	0
Continuous Input Embedding Size Search For Recommender Systems	Apr 7, 2023	Recommendation SystemsReinforcement Learning (RL)	—Unverified	0
DiffMimic: Efficient Motion Mimicking with Differentiable Physics	Apr 6, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	2
Persuading to Prepare for Quitting Smoking with a Virtual Coach: Using States and User Characteristics to Predict Behavior	Apr 5, 2023	Reinforcement Learning (RL)	—Unverified	0
AutoRL Hyperparameter Landscapes	Apr 5, 2023	AutoMLHyperparameter Optimization	CodeCode Available	0
A Multiagent CyberBattleSim for RL Cyber Operation Agents	Apr 3, 2023	CyberBattleSimReinforcement Learning (RL)	—Unverified	0
Quantitative Trading using Deep Q Learning	Apr 3, 2023	Q-Learningreinforcement-learning	—Unverified	0
Optimal Goal-Reaching Reinforcement Learning via Quasimetric Learning	Apr 3, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1
Unified Emulation-Simulation Training Environment for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified	0
A Tutorial Introduction to Reinforcement Learning	Apr 3, 2023	Q-Learningreinforcement-learning	—Unverified	0
Enabling A Network AI Gym for Autonomous Cyber Agents	Apr 3, 2023	Deep Reinforcement LearningOffline RL	—Unverified	0
Managing power grids through topology actions: A comparative study between advanced rule-based and reinforcement learning agents	Apr 3, 2023	ManagementReinforcement Learning (RL)	CodeCode Available	1
Risk-Sensitive and Robust Model-Based Reinforcement Learning and Planning	Apr 2, 2023	Decision MakingModel-based Reinforcement Learning	—Unverified	0
On Context Distribution Shift in Task Representation Learning for Offline Meta RL	Apr 1, 2023	continuous-controlContinuous Control	CodeCode Available	0
Mastering Pair Trading with Risk-Aware Recurrent Reinforcement Learning	Apr 1, 2023	PAIR TRADINGreinforcement-learning	—Unverified	0
Restarted Bayesian Online Change-point Detection for Non-Stationary Markov Decision Processes	Apr 1, 2023	Change Point DetectionReinforcement Learning (RL)	—Unverified	0
Multi-view Tensor Graph Neural Networks Through Reinforced Aggregation	Apr 1, 2023	Graph Representation LearningReinforcement Learning (RL)	CodeCode Available	1
Understanding Reinforcement Learning Algorithms: The Progress from Basic Q-learning to Proximal Policy Optimization	Mar 31, 2023	Offline RLQ-Learning	—Unverified	0
Accelerating exploration and representation learning with offline pre-training	Mar 31, 2023	Decision MakingNetHack	—Unverified	0
Language Models can Solve Computer Tasks	Mar 30, 2023	Language ModellingLarge Language Model	CodeCode Available	2
Learning in Factored Domains with Information-Constrained Visual Representations	Mar 30, 2023	Reinforcement Learning (RL)Representation Learning	—Unverified	0
When Learning Is Out of Reach, Reset: Generalization in Autonomous Visuomotor Reinforcement Learning	Mar 30, 2023	Reinforcement Learning (RL)	—Unverified	0
On the Analysis of Computational Delays in Reinforcement Learning-based Rate Adaptation Algorithms	Mar 30, 2023	Reinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 141 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified