Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14201–14250 of 15113 papers

Title	Date	Tasks	Status
Transferring Agent Behaviors from Videos via Motion GANs	Nov 21, 2017	General Reinforcement LearningGenerative Adversarial Network	—Unverified
Posterior Sampling for Large Scale Reinforcement Learning	Nov 21, 2017	reinforcement-learningReinforcement Learning	—Unverified
Teaching a Machine to Read Maps with Deep Reinforcement Learning	Nov 20, 2017	Deep Reinforcement LearningNavigate	CodeCode Available
Deep Reinforcement Learning for Multi-Resource Multi-Machine Job Scheduling	Nov 20, 2017	CPUDeep Reinforcement Learning	—Unverified
Classification with Costly Features using Deep Reinforcement Learning	Nov 20, 2017	ClassificationClassification with Costly Features	CodeCode Available
Leave no Trace: Learning to Reset for Safe and Autonomous Reinforcement Learning	Nov 18, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Neural Network Based Reinforcement Learning for Audio-Visual Gaze Control in Human-Robot Interaction	Nov 18, 2017	parameter estimationQ-Learning	—Unverified
Run, skeleton, run: skeletal model in a physics-based simulation	Nov 18, 2017	NavigatePolicy Gradient Methods	CodeCode Available
Hindsight policy gradients	Nov 16, 2017	Policy Gradient Methodsreinforcement-learning	CodeCode Available
Finding Efficient Swimming Strategies in a Three Dimensional Chaotic Flow by Reinforcement Learning	Nov 15, 2017	Navigatereinforcement-learning	—Unverified
Costate-focused models for reinforcement learning	Nov 15, 2017	reinforcement-learningReinforcement Learning	—Unverified
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems	Nov 15, 2017	Deep Reinforcement LearningEfficient Exploration	—Unverified
Markov Decision Processes with Continuous Side Information	Nov 15, 2017	PAC learningReinforcement Learning	—Unverified
Variational Adaptive-Newton Method for Explorative Learning	Nov 15, 2017	Active Learningreinforcement-learning	—Unverified
Saliency-based Sequential Image Attention with Multiset Prediction	Nov 14, 2017	ClassificationGeneral Classification	—Unverified
Reinforcement Learning in a large scale photonic Recurrent Neural Network	Nov 14, 2017	BIG-bench Machine Learningreinforcement-learning	—Unverified
Classical Structured Prediction Losses for Sequence to Sequence Learning	Nov 14, 2017	Abstractive Text SummarizationMachine Translation	—Unverified
Loss Functions for Multiset Prediction	Nov 14, 2017	Decision MakingPrediction	—Unverified
Accelerated Method for Stochastic Composition Optimization with Nonsmooth Regularization	Nov 10, 2017	Managementreinforcement-learning	—Unverified
Applications of Deep Learning and Reinforcement Learning to Biological Data	Nov 10, 2017	Deep Learningreinforcement-learning	—Unverified
Reinforcement Learning of Speech Recognition System Based on Policy Gradient and Hypothesis Selection	Nov 10, 2017	General Reinforcement Learningreinforcement-learning	—Unverified
Towards the Use of Deep Reinforcement Learning with Global Policy For Query-based Extractive Summarisation	Nov 10, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Worm-level Control through Search-based Reinforcement Learning	Nov 9, 2017	reinforcement-learningReinforcement Learning	—Unverified
An Empirical Analysis of Multiple-Turn Reasoning Strategies in Reading Comprehension Tasks	Nov 9, 2017	DescriptiveReading Comprehension	—Unverified
Energy Storage Arbitrage in Real-Time Markets via Reinforcement Learning	Nov 8, 2017	reinforcement-learningReinforcement Learning	—Unverified
LatentPoison - Adversarial Attacks On The Latent Space	Nov 8, 2017	DecoderGeneral Classification	CodeCode Available
Can Deep Reinforcement Learning Solve Erdos-Selfridge-Spencer Games?	Nov 7, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Double Q(σ) and Q(σ, λ): Unifying Reinforcement Learning Control Algorithms	Nov 5, 2017	Q-Learningreinforcement-learning	—Unverified
Composing Meta-Policies for Autonomous Driving Using Hierarchical Deep Reinforcement Learning	Nov 4, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Policy Optimization by Genetic Distillation	Nov 3, 2017	Deep Reinforcement LearningImitation Learning	—Unverified
A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning	Nov 2, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive coordination of working-memory and reinforcement learning in non-human primates performing a trial-and-error problem solving task	Nov 2, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Automatic Text Summarization Using Reinforcement Learning with Embedding Features	Nov 1, 2017	ARCInformation Retrieval	—Unverified
Intelligent Parameter Tuning in Optimization-based Iterative CT Reconstruction via Deep Reinforcement Learning	Nov 1, 2017	CT ReconstructionDeep Reinforcement Learning	—Unverified
Learning to Diagnose: Assimilating Clinical Narratives using Deep Reinforcement Learning	Nov 1, 2017	Decision MakingDeep Reinforcement Learning	—Unverified
Acquiring Target Stacking Skills by Goal-Parameterized Deep Reinforcement Learning	Nov 1, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Paraphrase Generation with Deep Reinforcement Learning	Nov 1, 2017	Deep Reinforcement LearningParaphrase Generation	—Unverified
Regret Minimization for Partially Observable Deep Reinforcement Learning	Oct 31, 2017	counterfactualDeep Reinforcement Learning	CodeCode Available
TreeQN and ATreeC: Differentiable Tree-Structured Models for Deep Reinforcement Learning	Oct 31, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available
Visualizing and Understanding Atari Agents	Oct 31, 2017	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Backpropagation through the Void: Optimizing control variates for black-box gradient estimation	Oct 31, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Automata-Guided Hierarchical Reinforcement Learning for Skill Composition	Oct 31, 2017	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Artificial Intelligence as Structural Estimation: Economic Interpretations of Deep Blue, Bonanza, and AlphaGo	Oct 30, 2017	EconometricsReinforcement Learning	—Unverified
Exponential improvements for quantum-accessible reinforcement learning	Oct 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
Action-depedent Control Variates for Policy Optimization via Stein's Identity	Oct 30, 2017	Policy Gradient Methodsreinforcement-learning	CodeCode Available
Predicting Head Movement in Panoramic Video: A Deep Reinforcement Learning Approach	Oct 30, 2017	Deep Reinforcement LearningPosition	CodeCode Available
Unifying Value Iteration, Advantage Learning, and Dynamic Policy Programming	Oct 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
Sequence-to-Sequence ASR Optimization via Reinforcement Learning	Oct 30, 2017	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning	Oct 28, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Inverse Reinforcement Learning Under Noisy Observations	Oct 27, 2017	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 285 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified