Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14151–14200 of 15113 papers

Title	Date	Tasks	Status	Hype
Markov Decision Processes with Continuous Side Information	Nov 15, 2017	PAC learningReinforcement Learning	—Unverified	0
Variational Adaptive-Newton Method for Explorative Learning	Nov 15, 2017	Active Learningreinforcement-learning	—Unverified	0
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems	Nov 15, 2017	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Finding Efficient Swimming Strategies in a Three Dimensional Chaotic Flow by Reinforcement Learning	Nov 15, 2017	Navigatereinforcement-learning	—Unverified	0
Costate-focused models for reinforcement learning	Nov 15, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Saliency-based Sequential Image Attention with Multiset Prediction	Nov 14, 2017	ClassificationGeneral Classification	—Unverified	0
Loss Functions for Multiset Prediction	Nov 14, 2017	Decision MakingPrediction	—Unverified	0
Reinforcement Learning in a large scale photonic Recurrent Neural Network	Nov 14, 2017	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Classical Structured Prediction Losses for Sequence to Sequence Learning	Nov 14, 2017	Abstractive Text SummarizationMachine Translation	—Unverified	0
SQLNet: Generating Structured Queries From Natural Language Without Reinforcement Learning	Nov 13, 2017	Decoderreinforcement-learning	CodeCode Available	2
Reinforcement Learning of Speech Recognition System Based on Policy Gradient and Hypothesis Selection	Nov 10, 2017	General Reinforcement Learningreinforcement-learning	—Unverified	0
Towards the Use of Deep Reinforcement Learning with Global Policy For Query-based Extractive Summarisation	Nov 10, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Accelerated Method for Stochastic Composition Optimization with Nonsmooth Regularization	Nov 10, 2017	Managementreinforcement-learning	—Unverified	0
Applications of Deep Learning and Reinforcement Learning to Biological Data	Nov 10, 2017	Deep Learningreinforcement-learning	—Unverified	0
An Empirical Analysis of Multiple-Turn Reasoning Strategies in Reading Comprehension Tasks	Nov 9, 2017	DescriptiveReading Comprehension	—Unverified	0
Worm-level Control through Search-based Reinforcement Learning	Nov 9, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
LatentPoison - Adversarial Attacks On The Latent Space	Nov 8, 2017	DecoderGeneral Classification	CodeCode Available	0
Energy Storage Arbitrage in Real-Time Markets via Reinforcement Learning	Nov 8, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Can Deep Reinforcement Learning Solve Erdos-Selfridge-Spencer Games?	Nov 7, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Double Q(σ) and Q(σ, λ): Unifying Reinforcement Learning Control Algorithms	Nov 5, 2017	Q-Learningreinforcement-learning	—Unverified	0
Composing Meta-Policies for Autonomous Driving Using Hierarchical Deep Reinforcement Learning	Nov 4, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Policy Optimization by Genetic Distillation	Nov 3, 2017	Deep Reinforcement LearningImitation Learning	—Unverified	0
Adaptive coordination of working-memory and reinforcement learning in non-human primates performing a trial-and-error problem solving task	Nov 2, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning	Nov 2, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Automatic Text Summarization Using Reinforcement Learning with Embedding Features	Nov 1, 2017	ARCInformation Retrieval	—Unverified	0
Learning to Diagnose: Assimilating Clinical Narratives using Deep Reinforcement Learning	Nov 1, 2017	Decision MakingDeep Reinforcement Learning	—Unverified	0
Intelligent Parameter Tuning in Optimization-based Iterative CT Reconstruction via Deep Reinforcement Learning	Nov 1, 2017	CT ReconstructionDeep Reinforcement Learning	—Unverified	0
Acquiring Target Stacking Skills by Goal-Parameterized Deep Reinforcement Learning	Nov 1, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Paraphrase Generation with Deep Reinforcement Learning	Nov 1, 2017	Deep Reinforcement LearningParaphrase Generation	—Unverified	0
Regret Minimization for Partially Observable Deep Reinforcement Learning	Oct 31, 2017	counterfactualDeep Reinforcement Learning	CodeCode Available	0
Backpropagation through the Void: Optimizing control variates for black-box gradient estimation	Oct 31, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
TreeQN and ATreeC: Differentiable Tree-Structured Models for Deep Reinforcement Learning	Oct 31, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Visualizing and Understanding Atari Agents	Oct 31, 2017	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Automata-Guided Hierarchical Reinforcement Learning for Skill Composition	Oct 31, 2017	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Learning Robust Rewards with Adversarial Inverse Reinforcement Learning	Oct 30, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Unifying Value Iteration, Advantage Learning, and Dynamic Policy Programming	Oct 30, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Exponential improvements for quantum-accessible reinforcement learning	Oct 30, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Predicting Head Movement in Panoramic Video: A Deep Reinforcement Learning Approach	Oct 30, 2017	Deep Reinforcement LearningPosition	CodeCode Available	0
Action-depedent Control Variates for Policy Optimization via Stein's Identity	Oct 30, 2017	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0
Eigenoption Discovery through the Deep Successor Representation	Oct 30, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Artificial Intelligence as Structural Estimation: Economic Interpretations of Deep Blue, Bonanza, and AlphaGo	Oct 30, 2017	EconometricsReinforcement Learning	—Unverified	0
Sequence-to-Sequence ASR Optimization via Reinforcement Learning	Oct 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning	Oct 28, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Reinforcement Learning with Quantile Regression	Oct 27, 2017	Atari GamesDistributional Reinforcement Learning	CodeCode Available	0
Inverse Reinforcement Learning Under Noisy Observations	Oct 27, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Generalization Tower Network: A Novel Deep Neural Network Architecture for Multi-Task Learning	Oct 27, 2017	Atari GamesMulti-Task Learning	CodeCode Available	0
Learning Approximate Stochastic Transition Models	Oct 26, 2017	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Accelerated Reinforcement Learning	Oct 23, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Exploiting generalization in the subspaces for faster model-based learning	Oct 22, 2017	Decision MakingReinforcement Learning	—Unverified	0
Insulin Regimen ML-based control for T2DM patients	Oct 21, 2017	Model-based Reinforcement LearningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 284 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified