Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2701–2725 of 15113 papers

Title	Date	Tasks	Status	Score
Interactive Query-Assisted Summarization via Deep Reinforcement Learning	Jul 1, 2022	Deep Reinforcement LearningInformativeness	CodeCode Available	5
Interactive Learning from Activity Description	Feb 13, 2021	General Reinforcement LearningGrounded language learning	CodeCode Available	5
Towards Abstractive Timeline Summarisation using Preference-based Reinforcement Learning	Nov 14, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Interactive Semantic Parsing for If-Then Recipes via Hierarchical Reinforcement Learning	Aug 21, 2018	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	5
Asynchronous Methods for Model-Based Reinforcement Learning	Oct 28, 2019	modelModel-based Reinforcement Learning	CodeCode Available	5
Air Learning: A Deep Reinforcement Learning Gym for Autonomous Aerial Robot Visual Navigation	Jun 2, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	5
A Hierarchical Framework for Relation Extraction with Reinforcement Learning	Nov 9, 2018	Entity Extraction using GANHierarchical Reinforcement Learning	CodeCode Available	5
Asynchronous Episodic Deep Deterministic Policy Gradient: Towards Continuous Control in Computationally Complex Environments	Mar 3, 2019	continuous-controlContinuous Control	CodeCode Available	5
Adapting to Reward Progressivity via Spectral Reinforcement Learning	Apr 29, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Intelligent Traffic Light via Policy-based Deep Reinforcement Learning	Dec 27, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Integrating Reinforcement Learning, Action Model Learning, and Numeric Planning for Tackling Complex Tasks	Feb 18, 2025	Imitation LearningMinecraft	CodeCode Available	5
Accuracy-based Curriculum Learning in Deep Reinforcement Learning	Jun 25, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
A Hierarchical Architecture for Sequential Decision-Making in Autonomous Driving using Deep Reinforcement Learning	Jun 20, 2019	Autonomous DrivingDecision Making	CodeCode Available	5
Intelligent Trainer for Model-Based Reinforcement Learning	May 24, 2018	modelModel-based Reinforcement Learning	CodeCode Available	5
Instance Weighted Incremental Evolution Strategies for Reinforcement Learning in Dynamic Environments	Oct 9, 2020	Incremental LearningQ-Learning	CodeCode Available	5
Instance Selection for Dynamic Algorithm Configuration with Reinforcement Learning: Improving Generalization	Jul 18, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Policy Iterations for Reinforcement Learning Problems in Continuous Time and Space -- Fundamental Theory and Methods	May 9, 2017	Decision MakingQ-Learning	CodeCode Available	5
Insights From the NeurIPS 2021 NetHack Challenge	Mar 22, 2022	NetHackReinforcement Learning (RL)	CodeCode Available	5
Instance based Generalization in Reinforcement Learning	Nov 2, 2020	Deep Reinforcement LearningGeneralization Bounds	CodeCode Available	5
Inherently Explainable Reinforcement Learning in Natural Language	Dec 16, 2021	Graph Attentionreinforcement-learning	CodeCode Available	5
Input Convex Neural Networks	Sep 22, 2016	ImputationInference Optimization	CodeCode Available	5
Information State Embedding in Partially Observable Cooperative Multi-Agent Reinforcement Learning	Apr 2, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
A2-RL: Aesthetics Aware Reinforcement Learning for Image Cropping	Sep 14, 2017	Decision MakingImage Cropping	CodeCode Available	5
Information-Theoretic State Variable Selection for Reinforcement Learning	Jan 21, 2024	Decision Makingfeature selection	CodeCode Available	5
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning	May 15, 2025	Efficient ExplorationImitation Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 109 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified