Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13351–13400 of 15113 papers

Title	Date	Tasks	Status	Hype
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Expressiveness in Deep Reinforcement Learning	Sep 27, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
Incremental Hierarchical Reinforcement Learning with Multitask LMDPs	Sep 27, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
A Convergent Variant of the Boltzmann Softmax Operator in Reinforcement Learning	Sep 27, 2018	Atari GamesQ-Learning	—Unverified	0
Exploiting Environmental Variation to Improve Policy Robustness in Reinforcement Learning	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Interactive Parallel Exploration for Reinforcement Learning in Continuous Action Spaces	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
DOMAIN ADAPTATION VIA DISTRIBUTION AND REPRESENTATION MATCHING: A CASE STUDY ON TRAINING DATA SELECTION VIA REINFORCEMENT LEARNING	Sep 27, 2018	Dependency ParsingDomain Adaptation	—Unverified	0
Unsupervised Exploration with Deep Model-Based Reinforcement Learning	Sep 27, 2018	modelModel-based Reinforcement Learning	—Unverified	0
Towards More Theoretically-Grounded Particle Optimization Sampling for Deep Learning	Sep 27, 2018	Deep LearningDeep Reinforcement Learning	—Unverified	0
The wisdom of the crowd: reliable deep reinforcement learning through ensembles of Q-functions	Sep 27, 2018	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Solving Statistical Mechanics Using Variational Autoregressive Networks	Sep 27, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1
Definition and evaluation of model-free coordination of electrical vehicle charging with reinforcement learning	Sep 27, 2018	Model Predictive Controlreinforcement-learning	—Unverified	0
Learning to Coordinate Multiple Reinforcement Learning Agents for Diverse Query Reformulation	Sep 27, 2018	DiversityQuestion Answering	—Unverified	0
Controllable Neural Story Plot Generation via Reward Shaping	Sep 27, 2018	Language ModelingLanguage Modelling	CodeCode Available	0
Omega-Regular Objectives in Model-Free Reinforcement Learning	Sep 26, 2018	modelreinforcement-learning	—Unverified	0
AlphaSeq: Sequence Discovery with Deep Reinforcement Learning	Sep 26, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning through Probing: a decentralized reinforcement learning architecture for social dilemmas	Sep 26, 2018	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Learning Navigation Behaviors End-to-End with AutoRL	Sep 26, 2018	Deep Reinforcement LearningMotion Planning	—Unverified	0
Floyd-Warshall Reinforcement Learning: Learning from Past Experiences to Reach New Goals	Sep 25, 2018	Q-Learningreinforcement-learning	—Unverified	0
Hierarchical Deep Multiagent Reinforcement Learning with Temporal Abstraction	Sep 25, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Resilient Computing with Reinforcement Learning on a Dynamical System: Case Study in Sorting	Sep 25, 2018	Decision Makingreinforcement-learning	—Unverified	0
Low Precision Policy Distillation with Application to Low-Power, Real-time Sensation-Cognition-Action Loop with Neuromorphic Computing	Sep 25, 2018	Atari Gamesreinforcement-learning	—Unverified	0
S-RL Toolbox: Environments, Datasets and Evaluation Metrics for State Representation Learning	Sep 25, 2018	Diversityreinforcement-learning	CodeCode Available	0
Anderson Acceleration for Reinforcement Learning	Sep 25, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Better Safe than Sorry: Evidence Accumulation Allows for Safe Reinforcement Learning	Sep 24, 2018	Decision Makingreinforcement-learning	CodeCode Available	0
EpiRL: A Reinforcement Learning Agent to Facilitate Epistasis Detection	Sep 24, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Personalized Education at Scale	Sep 24, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
SDN Flow Entry Management Using Reinforcement Learning	Sep 24, 2018	Deep Reinforcement LearningManagement	—Unverified	0
Crowd-Robot Interaction: Crowd-aware Robot Navigation with Attention-based Deep Reinforcement Learning	Sep 24, 2018	Deep Reinforcement LearningHuman Dynamics	CodeCode Available	1
On Reinforcement Learning for Full-length Game of StarCraft	Sep 23, 2018	CPUHierarchical Reinforcement Learning	—Unverified	0
A Learning Framework for High Precision Industrial Assembly	Sep 23, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Geometric Multi-Model Fitting by Deep Reinforcement Learning	Sep 22, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Interpretable Multi-Objective Reinforcement Learning through Policy Orchestration	Sep 21, 2018	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
Finite Sample Analysis of the GTD Policy Evaluation Algorithms in Markov Setting	Sep 21, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Constrained Exploration and Recovery from Experience Shaping	Sep 21, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Target Transfer Q-Learning and Its Convergence Analysis	Sep 21, 2018	Q-LearningReinforcement Learning	—Unverified	0
Sim-to-Real Transfer of Robot Learning with Variable Length Inputs	Sep 20, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Dynamic Weights in Multi-Objective Deep Reinforcement Learning	Sep 20, 2018	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	CodeCode Available	0
Benchmarking Reinforcement Learning Algorithms on Real-World Robots	Sep 20, 2018	Benchmarkingcontinuous-control	CodeCode Available	0
IntelligentCrowd: Mobile Crowdsensing via Multi-Agent Reinforcement Learning	Sep 20, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Interpretable Reinforcement Learning with Ensemble Methods	Sep 19, 2018	BIG-bench Machine LearningInterpretable Machine Learning	—Unverified	0
Prosocial or Selfish? Agents with different behaviors for Contract Negotiation using Reinforcement Learning	Sep 19, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Multiobjective Reinforcement Learning for Reconfigurable Adaptive Optimal Control of Manufacturing Processes	Sep 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
SCC-rFMQ Learning in Cooperative Markov Games with Continuous Actions	Sep 18, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Model-Free Adaptive Optimal Control of Episodic Fixed-Horizon Manufacturing Processes using Reinforcement Learning	Sep 18, 2018	Model Predictive ControlQ-Learning	CodeCode Available	0
Switching Isotropic and Directional Exploration with Parameter Space Noise in Deep Reinforcement Learning	Sep 18, 2018	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Adversarial Imitation via Variational Inverse Reinforcement Learning	Sep 17, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning	Sep 17, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning to Collaborate: Multi-Scenario Ranking via Multi-Agent Reinforcement Learning	Sep 17, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Automata Guided Reinforcement Learning With Demonstrations	Sep 17, 2018	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 268 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified