Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13851–13900 of 15113 papers

Title	Date	Tasks	Status
Discourse-Aware Neural Rewards for Coherent Text Generation	May 10, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Optimal Control of Space Heating	May 10, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
End-to-End Reinforcement Learning for Automatic Taxonomy Induction	May 10, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Metatrace Actor-Critic: Online Step-size Tuning by Meta-gradient Descent for Reinforcement Learning Control	May 10, 2018	Atari GamesMeta-Learning	—Unverified
Reward Estimation for Variance Reduction in Deep Reinforcement Learning	May 9, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Multimodal Hierarchical Reinforcement Learning Policy for Task-Oriented Visual Dialog	May 8, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
FFNet: Video Fast-Forwarding via Reinforcement Learning	May 8, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Page-wise Recommendations	May 7, 2018	Deep Reinforcement LearningRecommendation Systems	—Unverified
Planning and Learning with Stochastic Action Sets	May 7, 2018	Q-LearningReinforcement Learning	—Unverified
Multimodal Machine Translation with Reinforcement Learning	May 7, 2018	Image DescriptionMachine Translation	—Unverified
Deep Reinforcement Learning for Playing 2.5D Fighting Games	May 5, 2018	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Developing parsimonious ensembles using ensemble diversity within a reinforcement learning framework	May 5, 2018	Diversityreinforcement-learning	—Unverified
Exploration by Distributional Reinforcement Learning	May 4, 2018	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning	May 4, 2018	Collision AvoidanceDecision Making	CodeCode Available
VINE: An Open Source Interactive Data Visualization Tool for Neuroevolution	May 3, 2018	Data VisualizationEvolutionary Algorithms	CodeCode Available
A Reinforcement Learning Approach to Interactive-Predictive Neural Machine Translation	May 3, 2018	Machine Translationreinforcement-learning	CodeCode Available
Robust Deep Reinforcement Learning for Security and Safety in Autonomous Vehicle Systems	May 2, 2018	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Robust Log-Optimal Strategy with Reinforcement Learning	May 1, 2018	Managementreinforcement-learning	—Unverified
Falsification of Cyber-Physical Systems Using Deep Reinforcement Learning	May 1, 2018	Deep Reinforcement LearningDistributed Computing	—Unverified
Dialog-based Interactive Image Retrieval	May 1, 2018	Image Retrievalreinforcement-learning	CodeCode Available
Generating Interpretable Fuzzy Controllers using Particle Swarm Optimization and Genetic Programming	Apr 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Tree Search Algorithm for Sequence Labeling	Apr 29, 2018	ChunkingDecision Making	CodeCode Available
From Credit Assignment to Entropy Regularization: Two New Algorithms for Neural Sequence Prediction	Apr 29, 2018	Predictionreinforcement-learning	CodeCode Available
Towards Experienced Anomaly Detector through Reinforcement Learning	Apr 29, 2018	Anomaly Detectionreinforcement-learning	—Unverified
Sentiment Adaptive End-to-End Dialog Systems	Apr 28, 2018	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning to Acquire Navigation Skills for Wheel-Legged Robots in Complex Environments	Apr 27, 2018	Deep Reinforcement LearningNavigate	—Unverified
Decoupling Dynamics and Reward for Transfer Learning	Apr 27, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Action Categorization for Computationally Improved Task Learning and Planning	Apr 26, 2018	reinforcement-learningReinforcement Learning	—Unverified
Multiagent Soft Q-Learning	Apr 25, 2018	Policy Gradient MethodsQ-Learning	—Unverified
Towards Symbolic Reinforcement Learning with Common Sense	Apr 23, 2018	Common Sense ReasoningDeep Reinforcement Learning	CodeCode Available
Benchmarking projective simulation in navigation problems	Apr 23, 2018	BenchmarkingQ-Learning	—Unverified
Distributed Distributional Deterministic Policy Gradients	Apr 23, 2018	continuous-controlContinuous Control	CodeCode Available
Crawling in Rogue's dungeons with (partitioned) A3C	Apr 23, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
MQGrad: Reinforcement Learning of Gradient Quantization in Parameter Server	Apr 22, 2018	BIG-bench Machine LearningQuantization	—Unverified
Event Extraction with Generative Adversarial Imitation Learning	Apr 21, 2018	Event ExtractionFeature Engineering	—Unverified
PEORL: Integrating Symbolic Planning and Hierarchical Reinforcement Learning for Robust Decision-Making	Apr 20, 2018	Decision MakingHierarchical Reinforcement Learning	—Unverified
Cell Selection with Deep Reinforcement Learning in Sparse Mobile Crowdsensing	Apr 19, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Extract Coherent Summary via Deep Reinforcement Learning	Apr 19, 2018	Deep Reinforcement LearningExtractive Summarization	—Unverified
Lipschitz Continuity in Model-based Reinforcement Learning	Apr 19, 2018	modelModel-based Reinforcement Learning	CodeCode Available
Disentangling Controllable and Uncontrollable Factors of Variation by Interacting with the World	Apr 19, 2018	Disentanglementreinforcement-learning	—Unverified
A Study on Overfitting in Deep Reinforcement Learning	Apr 18, 2018	Deep Reinforcement LearningInductive Bias	CodeCode Available
Dialogue Learning with Human Teaching and Feedback in End-to-End Trainable Task-Oriented Dialogue Systems	Apr 18, 2018	Dialogue State TrackingImitation Learning	CodeCode Available
Automated vehicle's behavior decision making using deep reinforcement learning and high-fidelity simulation environment	Apr 17, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Model-Free Linear Quadratic Control via Reduction to Expert Prediction	Apr 17, 2018	continuous-controlContinuous Control	—Unverified
On Improving Deep Reinforcement Learning for POMDPs	Apr 17, 2018	Atari GamesDecision Making	—Unverified
State-Augmentation Transformations for Risk-Sensitive Reinforcement Learning	Apr 16, 2018	Q-Learningreinforcement-learning	—Unverified
Learning How to Self-Learn: Enhancing Self-Training Using Neural Reinforcement Learning	Apr 16, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
CytonRL: an Efficient Reinforcement Learning Open-source Toolkit Implemented in C++	Apr 14, 2018	GPUQ-Learning	CodeCode Available
Robust Dual View Deep Agent	Apr 13, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Optimizing Query Evaluations using Reinforcement Learning for Web Search	Apr 12, 2018	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 278 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified