Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13151–13200 of 15113 papers

Title	Date	Tasks	Status	Hype
Model Learning for Look-ahead Exploration in Continuous Control	Nov 20, 2018	continuous-controlContinuous Control	CodeCode Available	0
Reinforcement Learning of Active Vision for Manipulating Objects under Occlusions	Nov 20, 2018	Objectreinforcement-learning	CodeCode Available	0
Energy Efficiency in Reinforcement Learning for Wireless Sensor Networks	Nov 19, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning and Inverse Reinforcement Learning with System 1 and System 2	Nov 19, 2018	Recommendation Systemsreinforcement-learning	—Unverified	0
Simulated Autonomous Driving in a Realistic Driving Environment using Deep Reinforcement Learning and a Deterministic Finite State Machine	Nov 19, 2018	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Measurement-based adaptation protocol with quantum reinforcement learning in a Rigetti quantum computer	Nov 19, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Practical Deep Reinforcement Learning Approach for Stock Trading	Nov 19, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	3
Scalable agent alignment via reward modeling: a research direction	Nov 19, 2018	Atari Gamesreinforcement-learning	CodeCode Available	0
Reinforcement Learning with A* and a Deep Heuristic	Nov 19, 2018	Q-Learningreinforcement-learning	CodeCode Available	0
Learning Actionable Representations with Goal-Conditioned Policies	Nov 19, 2018	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	0
Policy Optimization with Model-based Explorations	Nov 18, 2018	Atari GamesDecision Making	—Unverified	0
Self-Organizing Maps for Storage and Transfer of Knowledge in Reinforcement Learning	Nov 18, 2018	Continual Learningreinforcement-learning	—Unverified	0
Recursive Sparse Pseudo-input Gaussian Process SARSA	Nov 17, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Parameter Sharing Reinforcement Learning Architecture for Multi Agent Driving Behaviors	Nov 17, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Emergence of linguistic conventions in multi-agent reinforcement learning	Nov 17, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Improving Automatic Source Code Summarization via Deep Reinforcement Learning	Nov 17, 2018	Code SummarizationDecoder	CodeCode Available	0
Autonomous Extraction of a Hierarchical Structure of Tasks in Reinforcement Learning, A Sequential Associate Rule Mining Approach	Nov 17, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Concept Learning through Deep Reinforcement Learning with Memory-Augmented Neural Networks	Nov 15, 2018	Deep Reinforcement LearningOne-Shot Learning	—Unverified	0
Intervention Aided Reinforcement Learning for Safe and Practical Policy Optimization in Navigation	Nov 15, 2018	Autonomous Navigationreinforcement-learning	—Unverified	0
Orthogonal Policy Gradient and Autonomous Driving Application	Nov 15, 2018	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Reward learning from human preferences and demonstrations in Atari	Nov 15, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Tight Bayesian Ambiguity Sets for Robust MDPs	Nov 15, 2018	Decision MakingReinforcement Learning	—Unverified	0
The Utility of Sparse Representations for Control in Reinforcement Learning	Nov 15, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Natural Environment Benchmarks for Reinforcement Learning	Nov 14, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Large-scale Interactive Recommendation with Tree-structured Policy Gradient	Nov 14, 2018	ClusteringInteractive Recommendation	—Unverified	0
Bayesian Reinforcement Learning in Factored POMDPs	Nov 14, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Emergence of Addictive Behaviors in Reinforcement Learning Agents	Nov 14, 2018	Q-Learningreinforcement-learning	—Unverified	0
Modelling the Dynamic Joint Policy of Teammates with Attention Multi-agent DDPG	Nov 13, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Image Captioning Based on a Hierarchical Attention Mechanism and Policy Gradient Optimization	Nov 13, 2018	Generative Adversarial NetworkImage Captioning	—Unverified	0
Deep Q learning for fooling neural networks	Nov 13, 2018	Q-LearningReinforcement Learning	CodeCode Available	0
Coordinating Disaster Emergency Response with Heuristic Reinforcement Learning	Nov 12, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Temporal Point Processes via Reinforcement Learning	Nov 12, 2018	Point Processesreinforcement-learning	—Unverified	0
Navigating Assistance System for Quadcopter with Deep Reinforcement Learning	Nov 12, 2018	Collision AvoidanceDeep Reinforcement Learning	—Unverified	0
Importance Weighted Evolution Strategies	Nov 12, 2018	CPUreinforcement-learning	—Unverified	0
Learning data augmentation policies using augmented random search	Nov 12, 2018	Data Augmentationreinforcement-learning	CodeCode Available	0
An initial attempt of combining visual selective attention with deep reinforcement learning	Nov 11, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
An Optimal Control View of Adversarial Machine Learning	Nov 11, 2018	BIG-bench Machine LearningData Poisoning	—Unverified	0
Optimizing Taxi Carpool Policies via Reinforcement Learning and Spatio-Temporal Mining	Nov 11, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Towards Governing Agent's Efficacy: Action-Conditional β-VAE for Deep Transparent Reinforcement Learning	Nov 11, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Product Title Refinement via Multi-Modal Generative Adversarial Learning	Nov 11, 2018	AttributeGenerative Adversarial Network	—Unverified	0
Reinforcement Learning Based Speech Enhancement for Robust Speech Recognition	Nov 10, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Diversity-Driven Extensible Hierarchical Reinforcement Learning	Nov 10, 2018	DiversityHierarchical Reinforcement Learning	CodeCode Available	0
Fully Convolutional Network with Multi-Step Reinforcement Learning for Image Processing	Nov 10, 2018	DenoisingImage Denoising	CodeCode Available	0
Learning Shaping Strategies in Human-in-the-loop Interactive Reinforcement Learning	Nov 10, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Automatic Test Case Prioritization and Selection in Continuous Integration	Nov 9, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Hierarchical Framework for Relation Extraction with Reinforcement Learning	Nov 9, 2018	Entity Extraction using GANHierarchical Reinforcement Learning	CodeCode Available	0
Correlation Filter Selection for Visual Tracking Using Reinforcement Learning	Nov 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Modular Architecture for StarCraft II with Deep Reinforcement Learning	Nov 8, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Memory-based Deep Reinforcement Learning for Obstacle Avoidance in UAV with Limited Environment Knowledge	Nov 8, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Meta-Learning for Multi-objective Reinforcement Learning	Nov 8, 2018	Computational Efficiencycontinuous-control	—Unverified	0

Show:10 25 50

← PrevPage 264 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified