Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13451–13500 of 15113 papers

Title	Date	Tasks	Status
Distilled Agent DQN for Provable Adversarial Robustness	Sep 27, 2018	Adversarial Robustnessreinforcement-learning	—Unverified
Exploration by Uncertainty in Reward Space	Sep 27, 2018	Atari GamesEfficient Exploration	—Unverified
A Convergent Variant of the Boltzmann Softmax Operator in Reinforcement Learning	Sep 27, 2018	Atari GamesQ-Learning	—Unverified
Learning Physics Priors for Deep Reinforcement Learing	Sep 27, 2018	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning to Coordinate Multiple Reinforcement Learning Agents for Diverse Query Reformulation	Sep 27, 2018	DiversityQuestion Answering	—Unverified
Expressiveness in Deep Reinforcement Learning	Sep 27, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Exploiting Environmental Variation to Improve Policy Robustness in Reinforcement Learning	Sep 27, 2018	reinforcement-learningReinforcement Learning	—Unverified
Countering Language Drift via Grounding	Sep 27, 2018	Language ModelingLanguage Modelling	—Unverified
Deep Reinforcement Learning of Universal Policies with Diverse Environment Summaries	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Incremental Hierarchical Reinforcement Learning with Multitask LMDPs	Sep 27, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Convergent Reinforcement Learning with Function Approximation: A Bilevel Optimization Perspective	Sep 27, 2018	Bilevel OptimizationQ-Learning	—Unverified
Constraining Action Sequences with Formal Languages for Deep Reinforcement Learning	Sep 27, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Hybrid Policies Using Inverse Rewards for Reinforcement Learning	Sep 27, 2018	OpenAI GymQ-Learning	—Unverified
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Better Baseline for Second Order Gradient Estimation in Stochastic Computation Graphs	Sep 27, 2018	Meta-LearningMulti-agent Reinforcement Learning	—Unverified
DOMAIN ADAPTATION VIA DISTRIBUTION AND REPRESENTATION MATCHING: A CASE STUDY ON TRAINING DATA SELECTION VIA REINFORCEMENT LEARNING	Sep 27, 2018	Dependency ParsingDomain Adaptation	—Unverified
Accelerated Value Iteration via Anderson Mixing	Sep 27, 2018	Atari GamesQ-Learning	—Unverified
DEEP ADVERSARIAL FORWARD MODEL	Sep 27, 2018	Image Generationmodel	—Unverified
Definition and evaluation of model-free coordination of electrical vehicle charging with reinforcement learning	Sep 27, 2018	Model Predictive Controlreinforcement-learning	—Unverified
Guided Exploration in Deep Reinforcement Learning	Sep 27, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Controllable Neural Story Plot Generation via Reward Shaping	Sep 27, 2018	Language ModelingLanguage Modelling	CodeCode Available
Learning Navigation Behaviors End-to-End with AutoRL	Sep 26, 2018	Deep Reinforcement LearningMotion Planning	—Unverified
Learning through Probing: a decentralized reinforcement learning architecture for social dilemmas	Sep 26, 2018	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
AlphaSeq: Sequence Discovery with Deep Reinforcement Learning	Sep 26, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Omega-Regular Objectives in Model-Free Reinforcement Learning	Sep 26, 2018	modelreinforcement-learning	—Unverified
S-RL Toolbox: Environments, Datasets and Evaluation Metrics for State Representation Learning	Sep 25, 2018	Diversityreinforcement-learning	CodeCode Available
Resilient Computing with Reinforcement Learning on a Dynamical System: Case Study in Sorting	Sep 25, 2018	Decision Makingreinforcement-learning	—Unverified
Anderson Acceleration for Reinforcement Learning	Sep 25, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hierarchical Deep Multiagent Reinforcement Learning with Temporal Abstraction	Sep 25, 2018	reinforcement-learningReinforcement Learning	—Unverified
Floyd-Warshall Reinforcement Learning: Learning from Past Experiences to Reach New Goals	Sep 25, 2018	Q-Learningreinforcement-learning	—Unverified
Low Precision Policy Distillation with Application to Low-Power, Real-time Sensation-Cognition-Action Loop with Neuromorphic Computing	Sep 25, 2018	Atari Gamesreinforcement-learning	—Unverified
EpiRL: A Reinforcement Learning Agent to Facilitate Epistasis Detection	Sep 24, 2018	reinforcement-learningReinforcement Learning	—Unverified
Better Safe than Sorry: Evidence Accumulation Allows for Safe Reinforcement Learning	Sep 24, 2018	Decision Makingreinforcement-learning	CodeCode Available
Personalized Education at Scale	Sep 24, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
SDN Flow Entry Management Using Reinforcement Learning	Sep 24, 2018	Deep Reinforcement LearningManagement	—Unverified
On Reinforcement Learning for Full-length Game of StarCraft	Sep 23, 2018	CPUHierarchical Reinforcement Learning	—Unverified
A Learning Framework for High Precision Industrial Assembly	Sep 23, 2018	reinforcement-learningReinforcement Learning	—Unverified
Geometric Multi-Model Fitting by Deep Reinforcement Learning	Sep 22, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Finite Sample Analysis of the GTD Policy Evaluation Algorithms in Markov Setting	Sep 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
Interpretable Multi-Objective Reinforcement Learning through Policy Orchestration	Sep 21, 2018	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Constrained Exploration and Recovery from Experience Shaping	Sep 21, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Target Transfer Q-Learning and Its Convergence Analysis	Sep 21, 2018	Q-LearningReinforcement Learning	—Unverified
Sim-to-Real Transfer of Robot Learning with Variable Length Inputs	Sep 20, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Benchmarking Reinforcement Learning Algorithms on Real-World Robots	Sep 20, 2018	Benchmarkingcontinuous-control	CodeCode Available
IntelligentCrowd: Mobile Crowdsensing via Multi-Agent Reinforcement Learning	Sep 20, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Weights in Multi-Objective Deep Reinforcement Learning	Sep 20, 2018	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	CodeCode Available
Interpretable Reinforcement Learning with Ensemble Methods	Sep 19, 2018	BIG-bench Machine LearningInterpretable Machine Learning	—Unverified
Prosocial or Selfish? Agents with different behaviors for Contract Negotiation using Reinforcement Learning	Sep 19, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Model-Free Adaptive Optimal Control of Episodic Fixed-Horizon Manufacturing Processes using Reinforcement Learning	Sep 18, 2018	Model Predictive ControlQ-Learning	CodeCode Available
SCC-rFMQ Learning in Cooperative Markov Games with Continuous Actions	Sep 18, 2018	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 270 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified