Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10701–10725 of 15113 papers

Title	Date	Tasks	Status
Safe Reinforcement Learning with Mixture Density Network: A Case Study in Autonomous Highway Driving	Jul 2, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Meta-Reinforced Multi-Domain State Generator for Dialogue Systems	Jul 1, 2020	Domain AdaptationMeta-Learning	—Unverified
Zero-shot Text Classification via Reinforced Self-training	Jul 1, 2020	ClassificationGeneral Classification	—Unverified
Student-Teacher Curriculum Learning via Reinforcement Learning: Predicting Hospital Inpatient Admission Location	Jul 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Personalization of Hearing Aid Compression by Human-In-Loop Deep Reinforcement Learning	Jul 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sequential Transfer in Reinforcement Learning with a Generative Model	Jul 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Semantic Guidance of Dialogue Generation with Reinforcement Learning	Jul 1, 2020	DecoderDialogue Generation	—Unverified
Developing cooperative policies for multi-stage tasks	Jul 1, 2020	Reinforcement Learning (RL)	—Unverified
A Generalized Reinforcement Learning Algorithm for Online 3D Bin-Packing	Jul 1, 2020	3D Bin PackingDeep Reinforcement Learning	—Unverified
Interaction-limited Inverse Reinforcement Learning	Jul 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Falsification-Based Robust Adversarial Reinforcement Learning	Jul 1, 2020	Autonomous VehiclesDecision Making	—Unverified
Convex Regularization in Monte-Carlo Tree Search	Jul 1, 2020	Atari GamesDecision Making	—Unverified
Composing Elementary Discourse Units in Abstractive Summarization	Jul 1, 2020	Abstractive Text Summarizationreinforcement-learning	—Unverified
Adaptive Discretization for Model-Based Reinforcement Learning	Jul 1, 2020	modelModel-based Reinforcement Learning	CodeCode Available
Group Equivariant Deep Reinforcement Learning	Jul 1, 2020	Deep Reinforcement LearningInductive Bias	CodeCode Available
Dynamic Regret of Policy Optimization in Non-stationary Environments	Jun 30, 2020	Reinforcement Learning (RL)	—Unverified
Deep reinforcement learning approach to MIMO precoding problem: Optimality and Robustness	Jun 30, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Feature Space: A Geometrical Perspective	Jun 30, 2020	Deep Reinforcement LearningDescriptive	CodeCode Available
Enforcing Almost-Sure Reachability in POMDPs	Jun 30, 2020	Decision Makingreinforcement-learning	CodeCode Available
Accelerating Reinforcement Learning Agent with EEG-based Implicit Human Feedback	Jun 30, 2020	Autonomous DrivingEEG	—Unverified
Testing match-3 video games with Deep Reinforcement Learning	Jun 30, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning: A Survey	Jun 30, 2020	Decision Makingmodel	—Unverified
Using Reinforcement Learning to Herd a Robotic Swarm to a Target Distribution	Jun 29, 2020	Q-Learningreinforcement-learning	—Unverified
Towards Learning-automation IoT Attack Detection through Reinforcement Learning	Jun 29, 2020	reinforcement-learningReinforcement Learning	—Unverified
Concept and the implementation of a tool to convert industry 4.0 environments modeled as FSM to an OpenAI Gym wrapper	Jun 29, 2020	OpenAI GymQ-Learning	—Unverified

Show:10 25 50

← PrevPage 429 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified