Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1125 of 15113 papers

Title	Date	Tasks	Status	Hype
DRLComplex: Reconstruction of protein quaternary structures using deep reinforcement learning	May 26, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multimodal Knowledge Alignment with Reinforcement Learning	May 25, 2022	Audio captioningLanguage Modeling	CodeCode Available	1
Scalable Multi-Agent Model-Based Reinforcement Learning	May 25, 2022	Mambamodel	CodeCode Available	1
History Compression via Language Models in Reinforcement Learning	May 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reward Uncertainty for Exploration in Preference-based Reinforcement Learning	May 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning	May 23, 2022	D4RLOffline RL	CodeCode Available	1
Learning to branch with Tree MDPs	May 23, 2022	Reinforcement Learning (RL)	CodeCode Available	1
Memory-efficient Reinforcement Learning with Value-based Knowledge Consolidation	May 22, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
ARLO: A Framework for Automated Reinforcement Learning	May 20, 2022	feature selectionMuJoCo	CodeCode Available	1
Beyond Greedy Search: Tracking by Multi-Agent Reinforcement Learning-based Beam Search	May 19, 2022	Decision MakingImage Captioning	CodeCode Available	1
Deep Reinforcement Learning for Time Allocation and Directional Transmission in Joint Radar-Communication	May 19, 2022	Autonomous VehiclesDecision Making Under Uncertainty	CodeCode Available	1
Time Series Anomaly Detection via Reinforcement Learning-Based Model Selection	May 19, 2022	Anomaly DetectionModel Selection	CodeCode Available	1
A2C is a special case of PPO	May 18, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Efficient Unsupervised Sentence Compression by Fine-tuning Transformers with Reinforcement Learning	May 17, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Reachability Constrained Reinforcement Learning	May 16, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
The Primacy Bias in Deep Reinforcement Learning	May 16, 2022	Atari Games 100kDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for Computational Fluid Dynamics on HPC Systems	May 13, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Intelligent Reflecting Surface Configurations for Smart Radio Using Deep Reinforcement Learning	May 11, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
VesNet-RL: Simulation-based Reinforcement Learning for Real-World US Probe Navigation	May 10, 2022	DiagnosticNavigate	CodeCode Available	1
State Encoders in Reinforcement Learning for Recommendation: A Reproducibility Study	May 10, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Efficient Risk-Averse Reinforcement Learning	May 10, 2022	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Gamma and Vega Hedging Using Deep Distributional Reinforcement Learning	May 10, 2022	Distributional Reinforcement LearningPosition	CodeCode Available	1
Learning to Brachiate via Simplified Model Imitation	May 8, 2022	Humanoid Controlmodel	CodeCode Available	1
DxFormer: A Decoupled Automatic Diagnostic System Based on Decoder-Encoder Transformer with Dense Symptom Representations	May 8, 2022	DecoderDiagnostic	CodeCode Available	1
Multivariate Prediction Intervals for Random Forests	May 4, 2022	PredictionPrediction Intervals	CodeCode Available	1

Show:10 25 50

← PrevPage 45 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified