Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1526–1550 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
DEIR: Efficient and Robust Exploration through Discriminative-Model-Based Episodic Intrinsic Rewards	Apr 21, 2023	Reinforcement Learning (RL)	CodeCode Available	1	5
Demonstration-free Autonomous Reinforcement Learning via Implicit and Bidirectional Curriculum	May 17, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Battlesnake Challenge: A Multi-agent Reinforcement Learning Playground with Human-in-the-loop	Jul 20, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
Demonstration-Guided Reinforcement Learning with Learned Skills	Jul 21, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
A Deep Reinforcement Learning Algorithm Using Dynamic Attention Model for Vehicle Routing Problems	Feb 9, 2020	Combinatorial OptimizationDecoder	CodeCode Available	1	5
Agent-Controller Representations: Principled Offline RL with Rich Exogenous Information	Oct 31, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1	5
Gated Hierarchical Attention for Image Captioning	Oct 30, 2018	DecoderImage Captioning	CodeCode Available	1	5
De novo PROTAC design using graph-based deep generative models	Nov 4, 2022	Reinforcement Learning (RL)	CodeCode Available	1	5
Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise Rollouts	May 7, 2021	Multi-agent Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning	Nov 4, 2018	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1	5
A Deep Reinforced Model for Zero-Shot Cross-Lingual Summarization with Bilingual Semantic Similarity Rewards	Jun 27, 2020	Machine Translationreinforcement-learning	CodeCode Available	1	5
Eagle: End-to-end Deep Reinforcement Learning based Autonomous Control of PTZ Cameras	Apr 10, 2023	Deep Reinforcement Learningobject-detection	CodeCode Available	1	5
Model-Based Visual Planning with Self-Supervised Functional Distances	Dec 30, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
ModelicaGym: Applying Reinforcement Learning to Modelica Models	Sep 18, 2019	Q-Learningreinforcement-learning	CodeCode Available	1	5
Modeling 3D Shapes by Reinforcement Learning	Mar 27, 2020	Deep Reinforcement LearningImitation Learning	CodeCode Available	1	5
GANterfactual-RL: Understanding Reinforcement Learning Agents' Strategies through Visual Counterfactual Explanations	Feb 24, 2023	counterfactualDecision Making	CodeCode Available	1	5
Developmental Reinforcement Learning of Control Policy of a Quadcopter UAV with Thrust Vectoring Rotors	Jul 15, 2020	Developmental LearningDrone Controller	CodeCode Available	1	5
Gaussian RAM: Lightweight Image Classification via Stochastic Retina-Inspired Glimpse and Reinforcement Learning	Nov 12, 2020	ClassificationGeneral Classification	CodeCode Available	1	5
Basis for Intentions: Efficient Inverse Reinforcement Learning using Past Experience	Aug 9, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
DGPO: Discovering Multiple Strategies with Diversity-Guided Policy Optimization	Jul 12, 2022	Diversityreinforcement-learning	CodeCode Available	1	5
Model Primitive Hierarchical Lifelong Reinforcement Learning	Mar 4, 2019	Hierarchical Reinforcement LearningLifelong learning	CodeCode Available	1	5
A Deep Reinforced Model for Abstractive Summarization	May 11, 2017	Abstractive Text SummarizationDecoder	CodeCode Available	1	5
Galactic: Scaling End-to-End Reinforcement Learning for Rearrangement at 100k Steps-Per-Second	Jun 13, 2023	GPUReinforcement Learning (RL)	CodeCode Available	1	5
Dialogue for Prompting: a Policy-Gradient-Based Discrete Prompt Generation for Few-shot Learning	Aug 14, 2023	Few-Shot LearningReinforcement Learning (RL)	CodeCode Available	1	5
Barrier Certified Safety Learning Control: When Sum-of-Square Programming Meets Reinforcement Learning	Jun 16, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 62 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified