Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10301–10325 of 15113 papers

Title	Date	Tasks	Status
A Sharp Analysis of Model-based Reinforcement Learning with Self-Play	Oct 4, 2020	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Test-Cost Sensitive Methods for Identifying Nearby Points	Oct 4, 2020	Deep Reinforcement LearningMissing Values	—Unverified
Mean-Variance Efficient Reinforcement Learning with Applications to Dynamic Financial Investment	Oct 3, 2020	Decision MakingDecision Making Under Uncertainty	—Unverified
Disentangling causal effects for hierarchical reinforcement learning	Oct 3, 2020	counterfactualDescriptive	—Unverified
Attractor Selection in Nonlinear Energy Harvesting Using Deep Reinforcement Learning	Oct 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Beyond Tabula-Rasa: a Modular Reinforcement Learning Approach for Physically Embedded 3D Sokoban	Oct 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Interactive Reinforcement Learning for Feature Selection with Decision Tree in the Loop	Oct 2, 2020	Feature Importancefeature selection	—Unverified
MADRaS : Multi Agent Driving Simulator	Oct 2, 2020	Autonomous DrivingCar Racing	—Unverified
Reinforcement Learning of Sequential Price Mechanisms	Oct 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Multi-Reward based Reinforcement Learning for Neural Machine Translation	Oct 1, 2020	Language ModelingLanguage Modelling	—Unverified
Emergent Social Learning via Multi-agent Reinforcement Learning	Oct 1, 2020	Imitation LearningMulti-agent Reinforcement Learning	—Unverified
Student-Initiated Action Advising via Advice Novelty	Oct 1, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available
Nearly Minimax Optimal Reinforcement Learning for Discounted MDPs	Oct 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Bayesian Meta-reinforcement Learning for Traffic Signal Control	Oct 1, 2020	Continual LearningMeta-Learning	—Unverified
Recognition Method of Important Words in Korean Text based on Reinforcement Learning	Oct 1, 2020	Classificationreinforcement-learning	—Unverified
Deep Reinforcement Learning with Mixed Convolutional Network	Oct 1, 2020	Data AugmentationDeep Reinforcement Learning	—Unverified
Bridging the gap between Markowitz planning and deep reinforcement learning	Sep 30, 2020	Asset ManagementAutonomous Driving	—Unverified
Finding It at Another Side: A Viewpoint-Adapted Matching Encoder for Change Captioning	Sep 30, 2020	Reinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Efficient Measurement of Quantum Devices	Sep 30, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
Accelerating Optimization and Reinforcement Learning with Quasi-Stochastic Approximation	Sep 30, 2020	reinforcement-learningReinforcement Learning	—Unverified
Graph-based Heuristic Search for Module Selection Procedure in Neural Module Network	Sep 30, 2020	Heuristic SearchQuestion Answering	—Unverified
AAMDRL: Augmented Asset Management with Deep Reinforcement Learning	Sep 30, 2020	Asset ManagementDeep Reinforcement Learning	—Unverified
Entropy Regularization for Mean Field Games with Learning	Sep 30, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Toolpath design for additive manufacturing using deep reinforcement learning	Sep 30, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Teacher-Critical Training Strategies for Image Captioning	Sep 30, 2020	Image CaptioningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 413 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified