Imitation Learning

Imitation Learning is a framework for learning a behavior policy from demonstrations. Usually, demonstrations are presented in the form of state-action trajectories, with each pair indicating the action to take at the state being visited. In order to learn the behavior policy, the demonstrated actions are usually utilized in two ways. The first, known as Behavior Cloning (BC), treats the action as the target label for each state, and then learns a generalized mapping from states to actions in a supervised manner. Another way, known as Inverse Reinforcement Learning (IRL), views the demonstrated actions as a sequence of decisions, and aims at finding a reward/cost function under which the demonstrated decisions are optimal.

Finally, a newer methodology, Inverse Q-Learning aims at directly learning Q-functions from expert data, implicitly representing rewards, under which the optimal policy can be given as a Boltzmann distribution similar to soft Q-learning

Source: Learning to Imitate

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1976–2000 of 2122 papers

Title	Date	Tasks	Status	Hype
Discriminator-Actor-Critic: Addressing Sample Inefficiency and Reward Bias in Adversarial Imitation Learning	Sep 9, 2018	Imitation LearningReinforcement Learning	CodeCode Available	0
Sample-Efficient Imitation Learning via Generative Adversarial Nets	Sep 6, 2018	continuous-controlContinuous Control	CodeCode Available	0
3D Ego-Pose Estimation via Imitation Learning	Sep 1, 2018	Domain AdaptationImitation Learning	—Unverified	0
Imitation Learning for Neural Morphological String Transduction	Aug 31, 2018	Imitation LearningLemmatization	CodeCode Available	0
Shared Multi-Task Imitation Learning for Indoor Self-Navigation	Aug 14, 2018	Imitation Learning	—Unverified	0
Risk-Sensitive Generative Adversarial Imitation Learning	Aug 13, 2018	Imitation LearningMuJoCo	—Unverified	0
Multi-Agent Generative Adversarial Imitation Learning	Jul 26, 2018	Imitation Learningreinforcement-learning	CodeCode Available	1
EnsembleDAgger: A Bayesian Approach to Safe Imitation Learning	Jul 22, 2018	Imitation LearningMuJoCo	—Unverified	0
Generative Adversarial Imitation from Observation	Jul 17, 2018	Imitation Learning	CodeCode Available	0
Bipedal Walking Robot using Deep Deterministic Policy Gradient	Jul 16, 2018	BIG-bench Machine LearningDecision Making	CodeCode Available	0
Extracting Contact and Motion from Manipulation Videos	Jul 13, 2018	ClusteringImitation Learning	—Unverified	0
CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving	Jul 10, 2018	Imitation Learningreinforcement-learning	—Unverified	0
Universal Planning Networks: Learning Generalizable Representations for Visuomotor Control	Jul 1, 2018	Imitation LearningReinforcement Learning	CodeCode Available	0
Learning How to Actively Learn: A Deep Imitation Learning Approach	Jul 1, 2018	Active LearningGeneral Classification	CodeCode Available	0
End-to-End Deep Imitation Learning: Robot Soccer Case Study	Jun 28, 2018	Imitation Learning	—Unverified	0
The Virtuous Machine - Old Ethics for New Technology?	Jun 27, 2018	Autonomous DrivingEthics	—Unverified	0
Adversarial Active Exploration for Inverse Dynamics Model Learning	Jun 26, 2018	Deep Reinforcement LearningImitation Learning	—Unverified	0
Learning Existing Social Conventions via Observationally Augmented Self-Play	Jun 26, 2018	Imitation LearningMulti-agent Reinforcement Learning	—Unverified	0
Learning Neural Parsers with Deterministic Differentiable Imitation Learning	Jun 20, 2018	Imitation LearningReinforcement Learning	—Unverified	0
Adaptive Input Estimation in Linear Dynamical Systems with Applications to Learning-from-Observations	Jun 19, 2018	Imitation Learning	—Unverified	0
Conditional Affordance Learning for Driving in Urban Environments	Jun 18, 2018	Autonomous DrivingAutonomous Navigation	CodeCode Available	0
Learning Policy Representations in Multiagent Systems	Jun 17, 2018	Clusteringcontinuous-control	—Unverified	0
Self-Imitation Learning	Jun 14, 2018	Atari GamesImitation Learning	CodeCode Available	0
Accelerating Imitation Learning with Predictive Models	Jun 12, 2018	Imitation LearningReinforcement Learning	—Unverified	0
AGIL: Learning Attention from Human for Visuomotor Tasks	Jun 1, 2018	Atari GamesDecision Making	—Unverified	0

Show:10 25 50

← PrevPage 80 of 85Next →

No leaderboard results yet.