Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2711–2720 of 15113 papers

Title	Date	Tasks	Status	Hype
Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 1, 2023	Deep Reinforcement LearningEdge-computing	CodeCode Available	1
Safe Reinforcement Learning in Tensor Reproducing Kernel Hilbert Space	Dec 1, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient Off-Policy Safe Reinforcement Learning Using Trust Region Conditional Value at Risk	Dec 1, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified	0
Optimal Attack and Defense for Reinforcement Learning	Nov 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Data-efficient Deep Reinforcement Learning for Vehicle Trajectory Control	Nov 30, 2023	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Controlgym: Large-Scale Control Environments for Benchmarking Reinforcement Learning Algorithms	Nov 30, 2023	BenchmarkingOpenAI Gym	CodeCode Available	1
Predictable Reinforcement Learning Dynamics through Entropy Rate Minimization	Nov 30, 2023	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0
Self-Driving Telescopes: Autonomous Scheduling of Astronomical Observation Campaigns with Offline Reinforcement Learning	Nov 29, 2023	AstronomyOffline RL	—Unverified	0
Unveiling the Implicit Toxicity in Large Language Models	Nov 29, 2023	Language ModellingReinforcement Learning (RL)	CodeCode Available	1
Q-learning Based Optimal False Data Injection Attack on Probabilistic Boolean Control Networks	Nov 29, 2023	Q-Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 272 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified