Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2701–2725 of 15113 papers

Title	Date	Tasks	Status	Hype
Integrated Drill Boom Hole-Seeking Control via Reinforcement Learning	Dec 4, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Foundations for Transfer in Reinforcement Learning: A Taxonomy of Knowledge Modalities	Dec 4, 2023	Computational Efficiencyreinforcement-learning	—Unverified	0
Self-Critical Alternate Learning based Semantic Broadcast Communication	Dec 3, 2023	Reinforcement Learning (RL)Semantic Communication	—Unverified	0
Learning Curricula in Open-Ended Worlds	Dec 3, 2023	Decision MakingDeep Reinforcement Learning	—Unverified	0
BenchMARL: Benchmarking Multi-Agent Reinforcement Learning	Dec 3, 2023	BenchmarkingMulti-agent Reinforcement Learning	—Unverified	0
A Multifidelity Sim-to-Real Pipeline for Verifiable and Compositional Reinforcement Learning	Dec 2, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Survey of Temporal Credit Assignment in Deep Reinforcement Learning	Dec 2, 2023	Decision MakingDeep Reinforcement Learning	—Unverified	0
Harnessing Discrete Representations For Continual Reinforcement Learning	Dec 2, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1
DDxT: Deep Generative Transformer Models for Differential Diagnosis	Dec 2, 2023	Reinforcement Learning (RL)Self-Supervised Learning	CodeCode Available	0
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version)	Dec 1, 2023	Keypoint DetectionReinforcement Learning (RL)	CodeCode Available	0
Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 1, 2023	Deep Reinforcement LearningEdge-computing	CodeCode Available	1
Safe Reinforcement Learning in Tensor Reproducing Kernel Hilbert Space	Dec 1, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient Off-Policy Safe Reinforcement Learning Using Trust Region Conditional Value at Risk	Dec 1, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified	0
Optimal Attack and Defense for Reinforcement Learning	Nov 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Data-efficient Deep Reinforcement Learning for Vehicle Trajectory Control	Nov 30, 2023	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Predictable Reinforcement Learning Dynamics through Entropy Rate Minimization	Nov 30, 2023	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0
Controlgym: Large-Scale Control Environments for Benchmarking Reinforcement Learning Algorithms	Nov 30, 2023	BenchmarkingOpenAI Gym	CodeCode Available	1
Self-Driving Telescopes: Autonomous Scheduling of Astronomical Observation Campaigns with Offline Reinforcement Learning	Nov 29, 2023	AstronomyOffline RL	—Unverified	0
Unveiling the Implicit Toxicity in Large Language Models	Nov 29, 2023	Language ModellingReinforcement Learning (RL)	CodeCode Available	1
Reinforcement Replaces Supervision: Query focused Summarization using Deep Reinforcement Learning	Nov 29, 2023	Deep Reinforcement LearningLong Form Question Answering	CodeCode Available	0
Two-Step Reinforcement Learning for Multistage Strategy Card Game	Nov 29, 2023	Card GamesDecision Making	—Unverified	0
Q-learning Based Optimal False Data Injection Attack on Probabilistic Boolean Control Networks	Nov 29, 2023	Q-Learningreinforcement-learning	—Unverified	0
Safe Reinforcement Learning in a Simulated Robotic Arm	Nov 28, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Two-step dynamic obstacle avoidance	Nov 28, 2023	NavigateReinforcement Learning (RL)	CodeCode Available	0
An Investigation of Time Reversal Symmetry in Reinforcement Learning	Nov 28, 2023	Data AugmentationFriction	CodeCode Available	0

Show:10 25 50

← PrevPage 109 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified