Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2701–2750 of 15113 papers

Title	Date	Tasks	Status	Hype
Foundations for Transfer in Reinforcement Learning: A Taxonomy of Knowledge Modalities	Dec 4, 2023	Computational Efficiencyreinforcement-learning	—Unverified	0
Integrated Drill Boom Hole-Seeking Control via Reinforcement Learning	Dec 4, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Curricula in Open-Ended Worlds	Dec 3, 2023	Decision MakingDeep Reinforcement Learning	—Unverified	0
Self-Critical Alternate Learning based Semantic Broadcast Communication	Dec 3, 2023	Reinforcement Learning (RL)Semantic Communication	—Unverified	0
BenchMARL: Benchmarking Multi-Agent Reinforcement Learning	Dec 3, 2023	BenchmarkingMulti-agent Reinforcement Learning	—Unverified	0
A Multifidelity Sim-to-Real Pipeline for Verifiable and Compositional Reinforcement Learning	Dec 2, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Survey of Temporal Credit Assignment in Deep Reinforcement Learning	Dec 2, 2023	Decision MakingDeep Reinforcement Learning	—Unverified	0
Harnessing Discrete Representations For Continual Reinforcement Learning	Dec 2, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1
DDxT: Deep Generative Transformer Models for Differential Diagnosis	Dec 2, 2023	Reinforcement Learning (RL)Self-Supervised Learning	CodeCode Available	0
Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement Learning Approach	Dec 1, 2023	Deep Reinforcement LearningEdge-computing	CodeCode Available	1
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version)	Dec 1, 2023	Keypoint DetectionReinforcement Learning (RL)	CodeCode Available	0
Efficient Off-Policy Safe Reinforcement Learning Using Trust Region Conditional Value at Risk	Dec 1, 2023	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified	0
Safe Reinforcement Learning in Tensor Reproducing Kernel Hilbert Space	Dec 1, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Optimal Attack and Defense for Reinforcement Learning	Nov 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Data-efficient Deep Reinforcement Learning for Vehicle Trajectory Control	Nov 30, 2023	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Predictable Reinforcement Learning Dynamics through Entropy Rate Minimization	Nov 30, 2023	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0
Controlgym: Large-Scale Control Environments for Benchmarking Reinforcement Learning Algorithms	Nov 30, 2023	BenchmarkingOpenAI Gym	CodeCode Available	1
Self-Driving Telescopes: Autonomous Scheduling of Astronomical Observation Campaigns with Offline Reinforcement Learning	Nov 29, 2023	AstronomyOffline RL	—Unverified	0
Q-learning Based Optimal False Data Injection Attack on Probabilistic Boolean Control Networks	Nov 29, 2023	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement Replaces Supervision: Query focused Summarization using Deep Reinforcement Learning	Nov 29, 2023	Deep Reinforcement LearningLong Form Question Answering	CodeCode Available	0
Unveiling the Implicit Toxicity in Large Language Models	Nov 29, 2023	Language ModellingReinforcement Learning (RL)	CodeCode Available	1
Two-Step Reinforcement Learning for Multistage Strategy Card Game	Nov 29, 2023	Card GamesDecision Making	—Unverified	0
Safe Reinforcement Learning in a Simulated Robotic Arm	Nov 28, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Two-step dynamic obstacle avoidance	Nov 28, 2023	NavigateReinforcement Learning (RL)	CodeCode Available	0
An Investigation of Time Reversal Symmetry in Reinforcement Learning	Nov 28, 2023	Data AugmentationFriction	CodeCode Available	0
Temporal Transfer Learning for Traffic Optimization with Coarse-grained Advisory Autonomy	Nov 27, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Optimal Observer Design Using Reinforcement Learning and Quadratic Neural Networks	Nov 27, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
A Graph Neural Network-Based QUBO-Formulated Hamiltonian-Inspired Loss Function for Combinatorial Optimization using Reinforcement Learning	Nov 27, 2023	Combinatorial OptimizationGraph Neural Network	—Unverified	0
Replay across Experiments: A Natural Extension of Off-Policy RL	Nov 27, 2023	Reinforcement Learning (RL)	—Unverified	0
A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning	Nov 27, 2023	Offline RLReinforcement Learning (RL)	—Unverified	0
Generative Modelling of Stochastic Actions with Arbitrary Constraints in Reinforcement Learning	Nov 26, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
A Nearly Optimal and Low-Switching Algorithm for Reinforcement Learning with General Function Approximation	Nov 26, 2023	Q-LearningReinforcement Learning (RL)	—Unverified	0
Margin Trader: A Reinforcement Learning Framework for Portfolio Management with Margin and Constraints	Nov 25, 2023	Deep Reinforcement LearningManagement	CodeCode Available	0
Projected Off-Policy Q-Learning (POP-QL) for Stabilizing Offline Reinforcement Learning	Nov 25, 2023	Q-LearningReinforcement Learning (RL)	—Unverified	0
Digital Twin-Native AI-Driven Service Architecture for Industrial Networks	Nov 24, 2023	Reinforcement Learning (RL)	—Unverified	0
Evaluating Pretrained models for Deployable Lifelong Learning	Nov 22, 2023	Atari Gamesclass-incremental learning	—Unverified	0
Risk-sensitive Markov Decision Process and Learning under General Utility Functions	Nov 22, 2023	Reinforcement Learning (RL)	—Unverified	0
Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents	Nov 22, 2023	Decision MakingLanguage Modeling	CodeCode Available	1
Learning to Fly in Seconds	Nov 22, 2023	GPUReinforcement Learning (RL)	CodeCode Available	2
Probabilistic Inference in Reinforcement Learning Done Right	Nov 22, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
From Images to Connections: Can DQN with GNNs learn the Strategic Game of Hex?	Nov 22, 2023	Board GamesInductive Bias	CodeCode Available	0
Analyzing Behaviors of Mixed Traffic via Reinforcement Learning at Unsignalized Intersections	Nov 21, 2023	Causal InferenceManagement	—Unverified	0
Resilient Control of Networked Microgrids using Vertical Federated Reinforcement Learning: Designs and Real-Time Test-Bed Validations	Nov 21, 2023	OpenAI GymReinforcement Learning (RL)	—Unverified	0
Clustered Policy Decision Ranking	Nov 21, 2023	Fault localizationReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning and Deep Stochastic Optimal Control for Final Quadratic Hedging	Nov 20, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Provably Efficient CVaR RL in Low-rank MDPs	Nov 20, 2023	Reinforcement Learning (RL)Representation Learning	—Unverified	0
Tactile Active Inference Reinforcement Learning for Efficient Robotic Manipulation Skill Acquisition	Nov 19, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Offline Reinforcement Learning for Wireless Network Optimization with Mixture Datasets	Nov 19, 2023	ManagementOffline RL	—Unverified	0
Benchmarking Feature Extractors for Reinforcement Learning-Based Semiconductor Defect Localization	Nov 18, 2023	BenchmarkingDeep Reinforcement Learning	—Unverified	0
Imagination-Augmented Hierarchical Reinforcement Learning for Safe and Interactive Autonomous Driving in Urban Environments	Nov 17, 2023	Autonomous DrivingHierarchical Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 55 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified