Imitation Learning

Imitation Learning is a framework for learning a behavior policy from demonstrations. Usually, demonstrations are presented in the form of state-action trajectories, with each pair indicating the action to take at the state being visited. In order to learn the behavior policy, the demonstrated actions are usually utilized in two ways. The first, known as Behavior Cloning (BC), treats the action as the target label for each state, and then learns a generalized mapping from states to actions in a supervised manner. Another way, known as Inverse Reinforcement Learning (IRL), views the demonstrated actions as a sequence of decisions, and aims at finding a reward/cost function under which the demonstrated decisions are optimal.

Finally, a newer methodology, Inverse Q-Learning aims at directly learning Q-functions from expert data, implicitly representing rewards, under which the optimal policy can be given as a Boltzmann distribution similar to soft Q-learning

Source: Learning to Imitate

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 2122 papers

Title	Date	Tasks	Status
Variable-Speed Teaching-Playback as Real-World Data Augmentation for Imitation Learning	Dec 4, 2024	Data AugmentationImitation Learning	—Unverified
Variational Adaptive Noise and Dropout towards Stable Recurrent Neural Networks	Jun 2, 2025	Imitation LearningLearning Theory	—Unverified
Goal-Conditioned Variational Autoencoder Trajectory Primitives with Continuous and Discrete Latent Codes	Dec 9, 2019	Data AugmentationDecoder	—Unverified
Variational Model-Based Imitation Learning in High-Dimensional Observation Spaces	Mar 9, 2021	Imitation LearningVocal Bursts Intensity Prediction	—Unverified
VectorPainter: Advanced Stylized Vector Graphics Synthesis Using Stroke-Style Priors	May 5, 2024	Imitation LearningVector Graphics	—Unverified
Versatile Skill Control via Self-supervised Adversarial Imitation of Unlabeled Mixed Motions	Sep 16, 2022	Imitation Learning	—Unverified
Injective State-Image Mapping facilitates Visual Adversarial Imitation Learning	Oct 2, 2018	Imitation Learning	—Unverified
VILD: Variational Imitation Learning with Diverse-quality Demonstrations	Sep 15, 2019	continuous-controlContinuous Control	—Unverified
VIN-NBV: A View Introspection Network for Next-Best-View Selection for Resource-Efficient 3D Reconstruction	May 9, 2025	3D ReconstructionImitation Learning	—Unverified
Vision-and-Language Navigation Generative Pretrained Transformer	May 27, 2024	DecoderImitation Learning	—Unverified
Vision-Language Foundation Models as Effective Robot Imitators	Nov 2, 2023	Imitation LearningRobot Manipulation	—Unverified
Visual Adversarial Imitation Learning using Variational Models	Jul 16, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
Visual Attention Prediction Improves Performance of Autonomous Drone Racing Agents	Jan 7, 2022	Decision MakingImitation Learning	—Unverified
Visual Encoders for Data-Efficient Imitation Learning in Modern Video Games	Dec 4, 2023	Atari GamesDecision Making	—Unverified
Visual Hindsight Self-Imitation Learning for Interactive Navigation	Dec 5, 2023	Imitation LearningVisual Navigation	—Unverified
Visual Imitation Learning with Calibrated Contrastive Representation	Jan 21, 2024	Contrastive LearningDecision Making	—Unverified
Towards Learning to Imitate from a Single Video Demonstration	Jan 22, 2019	Imitation LearningOne-Shot Learning	—Unverified
Visual Imitation Learning with Recurrent Siamese Networks	Sep 27, 2018	Imitation Learning	—Unverified
Visual Imitation Made Easy	Aug 11, 2020	Imitation Learning	—Unverified
Visual Imitation with a Minimal Adversary	May 1, 2019	Imitation LearningReinforcement Learning	—Unverified
Visual Semantic Planning using Deep Successor Representations	May 23, 2017	Imitation LearningReinforcement Learning	—Unverified
Visuospatial Skill Learning for Robots	Jun 3, 2017	Imitation Learning	—Unverified
VITaL Pretraining: Visuo-Tactile Pretraining for Tactile and Non-Tactile Manipulation Policies	Mar 18, 2024	Imitation Learning	—Unverified
VOILA: Visual-Observation-Only Imitation Learning for Autonomous Navigation	May 19, 2021	Autonomous NavigationImitation Learning	—Unverified
Wasserstein Adversarial Imitation Learning	Jun 19, 2019	Imitation Learningreinforcement-learning	—Unverified
Watch and Match: Supercharging Imitation with Regularized Optimal Transport	Jun 30, 2022	Decision MakingImitation Learning	—Unverified
Watch, Try, Learn: Meta-Learning from Demonstrations and Reward	Jun 7, 2019	Imitation LearningMeta-Learning	—Unverified
Watch, Try, Learn: Meta-Learning from Demonstrations and Rewards	May 1, 2020	Imitation LearningMeta-Learning	—Unverified
WayEx: Waypoint Exploration using a Single Demonstration	Jul 22, 2024	Imitation Learning	—Unverified
Waypoint-Based Imitation Learning for Robotic Manipulation	Jul 26, 2023	Decision MakingImitation Learning	—Unverified
WebWISE: Web Interface Control and Sequential Exploration with Large Language Models	Oct 24, 2023	Imitation LearningIn-Context Learning	—Unverified
Weighted Maximum Entropy Inverse Reinforcement Learning	Aug 20, 2022	Imitation Learningreinforcement-learning	—Unverified
What AIs are not Learning (and Why)	Mar 19, 2024	Imitation Learning	—Unverified
What data do we need for training an AV motion planner?	May 26, 2021	Imitation LearningMotion Planning	—Unverified
What is the Reward for Handwriting? -- Handwriting Generation by Imitation Learning	Sep 23, 2020	Handwriting generationImitation Learning	—Unverified
What Makes A Good Fisherman? Linear Regression under Self-Selection Bias	May 6, 2022	EconometricsImitation Learning	—Unverified
What Makes it Ok to Set a Fire? Iterative Self-distillation of Contexts and Rationales for Disambiguating Defeasible Social and Moral Situations	Oct 24, 2023	DiversityImitation Learning	—Unverified
What Matters for Adversarial Imitation Learning?	Jun 1, 2021	continuous-controlContinuous Control	—Unverified
What Matters for Batch Online Reinforcement Learning in Robotics?	May 12, 2025	Imitation LearningOffline RL	—Unverified
What Matters in Learning from Large-Scale Datasets for Robot Manipulation	Jun 16, 2025	DiversityImitation Learning	—Unverified
What Matters to Enhance Traffic Rule Compliance of Imitation Learning for End-to-End Autonomous Driving	Sep 14, 2023	Autonomous DrivingImitation Learning	—Unverified
What's the Move? Hybrid Imitation Learning via Salient Points	Dec 6, 2024	Imitation Learning	—Unverified
What Would pi* Do?: Imitation Learning via Off-Policy Reinforcement Learning	Sep 27, 2018	Imitation LearningQ-Learning	—Unverified
What Would the Expert do()?: Causal Imitation Learning	Sep 29, 2021	Imitation Learning	—Unverified
When Should We Prefer Offline Reinforcement Learning Over Behavioral Cloning?	Apr 12, 2022	Atari GamesDiagnostic	—Unverified
When Will Generative Adversarial Imitation Learning Algorithms Attain Global Convergence	Jun 24, 2020	Imitation Learning	—Unverified
Optimal Passenger-Seeking Policies on E-hailing Platforms Using Markov Decision Process and Imitation Learning	May 23, 2019	Imitation LearningReinforcement Learning	—Unverified
WildLMa: Long Horizon Loco-Manipulation in the Wild	Nov 22, 2024	Imitation Learning	—Unverified
WoMAP: World Models For Embodied Open-Vocabulary Object Localization	Jun 2, 2025	Active Object LocalizationEfficient Exploration	—Unverified
World-aware Planning Narratives Enhance Large Vision-Language Model Planner	Jun 26, 2025	Imitation LearningLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 28 of 43Next →

No leaderboard results yet.