Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14051–14100 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning for Programming Language Correction	Jan 31, 2018	Deep Reinforcement LearningMachine Translation	CodeCode Available
Pretraining Deep Actor-Critic Reinforcement Learning Algorithms With Expert Demonstrations	Jan 31, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning using Capsules in Advanced Game Environments	Jan 29, 2018	Deep Reinforcement LearningGeneral Classification	—Unverified
Barrier-Certified Adaptive Reinforcement Learning with Applications to Brushbot Navigation	Jan 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning the Reward Function for a Misspecified Model	Jan 29, 2018	modelModel-based Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Dynamic Treatment Regimes on Medical Registry Data	Jan 28, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
FlashRL: A Reinforcement Learning Platform for Flash Games	Jan 26, 2018	CPUDiversity	—Unverified
Directly Estimating the Variance of the λ-Return Using Temporal-Difference Methods	Jan 25, 2018	reinforcement-learningReinforcement Learning	—Unverified
Psychlab: A Psychology Laboratory for Deep Reinforcement Learning Agents	Jan 24, 2018	Change DetectionDeep Reinforcement Learning	CodeCode Available
Analyzing Language Learned by an Active Question Answering Agent	Jan 23, 2018	Information RetrievalQuestion Answering	—Unverified
Curiosity-driven reinforcement learning with homeostatic regulation	Jan 23, 2018	reinforcement-learningReinforcement Learning	—Unverified
Cross-Domain Transfer in Reinforcement Learning using Target Apprentice	Jan 22, 2018	reinforcement-learningReinforcement Learning	—Unverified
A Deep Reinforcement Learning Chatbot (Short Version)	Jan 20, 2018	ChatbotDeep Reinforcement Learning	—Unverified
Learning model-based strategies in simple environments with hierarchical q-networks	Jan 20, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning	Jan 18, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Experience-driven Networking: A Deep Reinforcement Learning based Approach	Jan 17, 2018	continuous-controlContinuous Control	—Unverified
Reinforcement Learning based Recommender System using Biclustering Technique	Jan 17, 2018	Recommendation Systemsreinforcement-learning	—Unverified
The QLBS Q-Learner Goes NuQLear: Fitted Q Iteration, Inverse RL, and Option Portfolios	Jan 17, 2018	Q-Learningreinforcement-learning	—Unverified
The Case for Automatic Database Administration using Deep Reinforcement Learning	Jan 17, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Cellular-Connected UAVs over 5G: Deep Reinforcement Learning for Interference Management	Jan 16, 2018	Deep Reinforcement LearningManagement	—Unverified
GitGraph - Architecture Search Space Creation through Frequent Computational Subgraph Mining	Jan 16, 2018	Evolutionary AlgorithmsNeural Architecture Search	—Unverified
Cooperative Multi-Agent Reinforcement Learning for Low-Level Wireless Communication	Jan 14, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Fuzzing	Jan 14, 2018	Q-Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning of Cell Movement in the Early Stage of C. elegans Embryogenesis	Jan 14, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Autonomous Driving in Reality with Reinforcement Learning and Image Translation	Jan 13, 2018	Autonomous DrivingCar Racing	—Unverified
Expected Policy Gradients for Reinforcement Learning	Jan 10, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
DeepTraffic: Crowdsourced Hyperparameter Tuning of Deep Reinforcement Learning Systems for Multi-Agent Dense Traffic Navigation	Jan 9, 2018	Autonomous DrivingAutonomous Navigation	CodeCode Available
Distributed Deep Reinforcement Learning: Learn how to play Atari games in 21 minutes	Jan 9, 2018	Atari GamesCPU	CodeCode Available
Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations	Jan 7, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Trading the Twitter Sentiment with Reinforcement Learning	Jan 7, 2018	BIG-bench Machine LearningQ-Learning	—Unverified
Sample-Efficient Reinforcement Learning through Transfer and Architectural Priors	Jan 7, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Using reinforcement learning to learn how to play text-based games	Jan 6, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Faster Deep Q-learning using Neural Episodic Control	Jan 6, 2018	Deep Reinforcement LearningQ-Learning	—Unverified
Jointly Learning to Construct and Control Agents using Deep Reinforcement Learning	Jan 4, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning based Optimal Control of Hot Water Systems	Jan 4, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Long Term Memory Network for Combinatorial Optimization Problems	Jan 1, 2018	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Learning Gaussian Policies from Smoothed Action Value Functions	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
Action-dependent Control Variates for Policy Optimization via Stein Identity	Jan 1, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified
Learning objects from pixels	Jan 1, 2018	Atari GamesObject	—Unverified
LatentPoison -- Adversarial Attacks On The Latent Space	Jan 1, 2018	DecoderGeneral Classification	—Unverified
Faster Reinforcement Learning with Expert State Sequences	Jan 1, 2018	Imitation Learningreinforcement-learning	—Unverified
A Hierarchical Model for Device Placement	Jan 1, 2018	Deep Reinforcement LearningMachine Translation	—Unverified
AUTOMATA GUIDED HIERARCHICAL REINFORCEMENT LEARNING FOR ZERO-SHOT SKILL COMPOSITION	Jan 1, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Domain Adaptation for Deep Reinforcement Learning in Visually Distinct Games	Jan 1, 2018	Deep Reinforcement LearningDomain Adaptation	—Unverified
Latent forward model for Real-time Strategy game planning with incomplete information	Jan 1, 2018	Atari GamesDecision Making	—Unverified
Alpha-divergence bridges maximum likelihood and reinforcement learning in neural sequence generation	Jan 1, 2018	Machine Translationreinforcement-learning	—Unverified
A dynamic game approach to training robust deep policies	Jan 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Do Deep Reinforcement Learning Algorithms really Learn to Navigate?	Jan 1, 2018	Deep Reinforcement LearningNavigate	—Unverified
Exploring Deep Recurrent Models with Reinforcement Learning for Molecule Design	Jan 1, 2018	Drug DiscoveryOpenAI Gym	—Unverified
Learning Robust Rewards with Adverserial Inverse Reinforcement Learning	Jan 1, 2018	Decision MakingDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 282 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified