Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2875 of 15113 papers

Title	Date	Tasks	Status	Score
Improving Robustness of Deep Reinforcement Learning Agents: Environment Attack based on the Critic Network	Apr 7, 2021	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	5
Improving Reinforcement Learning Based Image Captioning with Natural Language Prior	Sep 13, 2018	Image Captioningreinforcement-learning	CodeCode Available	5
RH-Net: Improving Neural Relation Extraction via Reinforcement Learning and Hierarchical Relational Searching	Oct 27, 2020	Denoisingreinforcement-learning	CodeCode Available	5
Improving Post-Processing of Audio Event Detectors Using Reinforcement Learning	Aug 19, 2022	Classificationreinforcement-learning	CodeCode Available	5
Improving Portfolio Optimization Results with Bandit Networks	Oct 5, 2024	Portfolio OptimizationRecommendation Systems	CodeCode Available	5
Improving reinforcement learning algorithms: towards optimal learning rate policies	Nov 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improving Generalization in Reinforcement Learning Training Regimes for Social Robot Navigation	Aug 29, 2023	Decision MakingNavigate	CodeCode Available	5
Improving Optimization Bounds using Machine Learning: Decision Diagrams meet Deep Reinforcement Learning	Sep 10, 2018	BIG-bench Machine LearningCombinatorial Optimization	CodeCode Available	5
Improving Policy Learning via Language Dynamics Distillation	Sep 30, 2022	NetHackReinforcement Learning (RL)	CodeCode Available	5
Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning	Mar 25, 2016	reinforcement-learningReinforcement Learning	CodeCode Available	5
Network Randomization: A Simple Technique for Generalization in Deep Reinforcement Learning	Oct 11, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	5
Improving Policy Optimization with Generalist-Specialist Learning	Jun 26, 2022	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
Improving the sample-efficiency of neural architecture search with reinforcement learning	Oct 13, 2021	AutoMLDeep Learning	CodeCode Available	5
Information-Directed Exploration for Deep Reinforcement Learning	Dec 18, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Improving Experience Replay through Modeling of Similar Transitions' Sets	Nov 12, 2021	Atari Gamesreinforcement-learning	CodeCode Available	5
A Simple, Fast Diverse Decoding Algorithm for Neural Generation	Nov 25, 2016	Abstractive Text SummarizationDiversity	CodeCode Available	5
Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents	Dec 18, 2017	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	5
Improving Environment Robustness of Deep Reinforcement Learning Approaches for Autonomous Racing Using Bayesian Optimization-based Curriculum Learning	Dec 16, 2023	Autonomous DrivingAutonomous Racing	CodeCode Available	5
Improving Exploration in Soft-Actor-Critic with Normalizing Flows Policies	Jun 6, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
Improving Deep Reinforcement Learning by Reducing the Chain Effect of Value and Policy Churn	Sep 7, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Improving Coordination in Small-Scale Multi-Agent Deep Reinforcement Learning through Memory-driven Communication	Jan 12, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	5
Improving Dialogue Management: Quality Datasets vs Models	Oct 2, 2023	Dialog LearningDialogue Management	CodeCode Available	5
Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to ATARI games	Mar 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Improved Sample Complexity Bounds for Distributionally Robust Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning	Jan 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 115 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified