Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14301–14350 of 15113 papers

Title	Date	Tasks	Status
Iterative Policy Learning in End-to-End Trainable Task-Oriented Neural Dialog Models	Sep 18, 2017	Deep Reinforcement LearningReinforcement Learning	—Unverified
Guided Deep Reinforcement Learning for Swarm Systems	Sep 18, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Why Pay More When You Can Pay Less: A Joint Learning Framework for Active Feature Acquisition and Classification	Sep 18, 2017	General ClassificationReinforcement Learning	—Unverified
N2N Learning: Network to Network Compression via Policy Gradient Reinforcement Learning	Sep 18, 2017	Model Compressionreinforcement-learning	—Unverified
Improving Search through A3C Reinforcement Learning based Conversational Agent	Sep 17, 2017	Q-Learningreinforcement-learning	—Unverified
Closing the loop between neural network simulators and the OpenAI Gym	Sep 17, 2017	OpenAI Gymreinforcement-learning	—Unverified
Deep Reinforcement Learning for Conversational AI	Sep 15, 2017	Deep LearningDeep Reinforcement Learning	CodeCode Available
Shapechanger: Environments for Transfer Learning	Sep 15, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning	Sep 15, 2017	Deep Reinforcement LearningManagement	—Unverified
Unsupervised state representation learning with robotic priors: a robustness benchmark	Sep 15, 2017	PositionReinforcement Learning	—Unverified
Shared Learning : Enhancing Reinforcement in Q-Ensembles	Sep 14, 2017	Atari Gamescontinuous-control	—Unverified
Towards personalized human AI interaction - adapting the behavior of AI agents using neural signatures of subjective interest	Sep 14, 2017	AI AgentBrain Computer Interface	—Unverified
A2-RL: Aesthetics Aware Reinforcement Learning for Image Cropping	Sep 14, 2017	Decision MakingImage Cropping	CodeCode Available
Autonomous Extracting a Hierarchical Structure of Tasks in Reinforcement Learning and Multi-task Reinforcement Learning	Sep 14, 2017	reinforcement-learningReinforcement Learning	—Unverified
A Study of AI Population Dynamics with Million-agent Reinforcement Learning	Sep 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Linear Stochastic Approximation: Constant Step-Size and Iterate Averaging	Sep 12, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning with Surrogate Agent-Environment Interface	Sep 12, 2017	continuous-controlContinuous Control	—Unverified
Explore, Exploit or Listen: Combining Human Feedback and Policy Model to Speed up Deep Reinforcement Learning in 3D Worlds	Sep 12, 2017	Deep Reinforcement LearningMinecraft	—Unverified
Pre-training Neural Networks with Human Demonstrations for Deep Reinforcement Learning	Sep 12, 2017	Atari GamesDeep Reinforcement Learning	—Unverified
Autonomous Quadrotor Landing using Deep Reinforcement Learning	Sep 11, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
MBMF: Model-Based Priors for Model-Free Reinforcement Learning	Sep 10, 2017	modelreinforcement-learning	—Unverified
Mirror Descent Search and its Acceleration	Sep 8, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
TensorFlow Agents: Efficient Batched Reinforcement Learning in TensorFlow	Sep 8, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Ultimate Intelligence Part III: Measures of Intelligence, Perception and Intelligent Agents	Sep 8, 2017	reinforcement-learningReinforcement Learning	—Unverified
Prosocial learning agents solve generalized Stag Hunts better than selfish ones	Sep 8, 2017	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Formulation of Deep Reinforcement Learning Architecture Toward Autonomous Driving for On-Ramp Merge	Sep 7, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Approximating meta-heuristics with homotopic recurrent neural networks	Sep 7, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A Deep Reinforcement Learning Chatbot	Sep 7, 2017	ChatbotDeep Reinforcement Learning	—Unverified
Towards Neural Machine Translation with Latent Tree Attention	Sep 6, 2017	DecoderMachine Translation	—Unverified
BOOK: Storing Algorithm-Invariant Episodes for Deep Reinforcement Learning	Sep 5, 2017	Deep Reinforcement LearningImitation Learning	—Unverified
Learning what to read: Focused machine reading	Sep 1, 2017	Reading ComprehensionReinforcement Learning	—Unverified
BIBI System Description: Building with CNNs and Breaking with Deep Reinforcement Learning	Sep 1, 2017	Deep Reinforcement LearningQ-Learning	—Unverified
Agent-Aware Dropout DQN for Safe and Efficient On-line Dialogue Policy Learning	Sep 1, 2017	Automatic Speech Recognition (ASR)Dialogue Management	—Unverified
Mean Actor Critic	Sep 1, 2017	Atari Gamesreinforcement-learning	CodeCode Available
Speeding up Reinforcement Learning-based Information Extraction Training using Asynchronous Methods	Sep 1, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Resilient Autonomous Control of Distributed Multi-agent Systems in Contested Environments	Aug 31, 2017	reinforcement-learningReinforcement Learning	—Unverified
Optimal and Learning Control for Autonomous Robots	Aug 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
Asymptotic Bias of Stochastic Gradient Search	Aug 30, 2017	reinforcement-learningReinforcement Learning	—Unverified
Safe Reinforcement Learning via Shielding	Aug 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
ChemGAN challenge for drug discovery: can AI reproduce natural chemical diversity?	Aug 28, 2017	DiversityDrug Discovery	CodeCode Available
Novel Sensor Scheduling Scheme for Intruder Tracking in Energy Efficient Sensor Networks	Aug 27, 2017	Intrusion DetectionReinforcement Learning	—Unverified
A Function Approximation Method for Model-based High-Dimensional Inverse Reinforcement Learning	Aug 23, 2017	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in POMDPs with Memoryless Options and Option-Observation Initiation Sets	Aug 22, 2017	reinforcement-learningReinforcement Learning	—Unverified
Solving a New 3D Bin Packing Problem with Deep Reinforcement Learning Method	Aug 20, 2017	3D Bin PackingCombinatorial Optimization	—Unverified
A Brief Survey of Deep Reinforcement Learning	Aug 19, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
StarCraft II: A New Challenge for Reinforcement Learning	Aug 16, 2017	Deep Reinforcement LearningReal-Time Strategy Games	CodeCode Available
Deep Reinforcement Learning for High Precision Assembly Tasks	Aug 14, 2017	Deep Reinforcement LearningPosition	—Unverified
Deep Object-Centric Representations for Generalizable Robot Learning	Aug 14, 2017	ObjectReinforcement Learning	CodeCode Available
Group-driven Reinforcement Learning for Personalized mHealth Intervention	Aug 14, 2017	ClusteringDecision Making	CodeCode Available
Attention-Aware Face Hallucination via Deep Reinforcement Learning	Aug 10, 2017	Deep Reinforcement LearningFace Hallucination	—Unverified

Show:10 25 50

← PrevPage 287 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified