Imitation Learning

Imitation Learning is a framework for learning a behavior policy from demonstrations. Usually, demonstrations are presented in the form of state-action trajectories, with each pair indicating the action to take at the state being visited. In order to learn the behavior policy, the demonstrated actions are usually utilized in two ways. The first, known as Behavior Cloning (BC), treats the action as the target label for each state, and then learns a generalized mapping from states to actions in a supervised manner. Another way, known as Inverse Reinforcement Learning (IRL), views the demonstrated actions as a sequence of decisions, and aims at finding a reward/cost function under which the demonstrated decisions are optimal.

Finally, a newer methodology, Inverse Q-Learning aims at directly learning Q-functions from expert data, implicitly representing rewards, under which the optimal policy can be given as a Boltzmann distribution similar to soft Q-learning

Source: Learning to Imitate

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 626–650 of 2122 papers

Title	Date	Tasks	Status
FoldNet: Learning Generalizable Closed-Loop Policy for Garment Folding via Keypoint-Driven Asset and Demonstration Synthesis	May 14, 2025	Imitation Learning	—Unverified
For Pre-Trained Vision Models in Motor Control, Not All Policy Learning Methods are Created Equal	Apr 10, 2023	AllImitation Learning	—Unverified
Decision Making for Autonomous Driving via Augmented Adversarial Inverse Reinforcement Learning	Nov 19, 2019	Autonomous DrivingDecision Making	—Unverified
Active Hierarchical Imitation and Reinforcement Learning	Dec 14, 2020	Active LearningImitation Learning	—Unverified
A survey of air combat behavior modeling using machine learning	Apr 22, 2024	Imitation LearningSurvey	—Unverified
Combining Imitation and Reinforcement Learning with Free Energy Principle	Jan 1, 2021	Imitation Learningreinforcement-learning	—Unverified
Flight-connection Prediction for Airline Crew Scheduling to Construct Initial Clusters for OR Optimizer	Sep 26, 2020	General ClassificationImitation Learning	—Unverified
FlowHFT: Imitation Learning via Flow Matching Policy for Optimal High-Frequency Trading under Diverse Market Conditions	May 9, 2025	Imitation Learning	—Unverified
A Study of Imitation Learning Methods for Semantic Role Labeling	Nov 1, 2016	Imitation LearningSemantic Role Labeling	—Unverified
Collaborating Action by Action: A Multi-agent LLM Framework for Embodied Reasoning	Apr 24, 2025	Imitation LearningMinecraft	—Unverified
Causal Confusion and Reward Misidentification in Preference-Based Reward Learning	Apr 13, 2022	Imitation Learning	—Unverified
Extending Multilingual Machine Translation through Imitation Learning	Nov 14, 2023	Imitation LearningMachine Translation	—Unverified
Expressive Whole-Body Control for Humanoid Robots	Feb 26, 2024	Imitation Learning	—Unverified
COIN: Chance-Constrained Imitation Learning for Uncertainty-aware Adaptive Resource Oversubscription Policy	Jan 13, 2024	Imitation LearningManagement	—Unverified
Exposing the Copycat Problem of Imitation-based Planner: A Novel Closed-Loop Simulator, Causal Benchmark and Joint IL-RL Baseline	Apr 20, 2025	Imitation Learningreinforcement-learning	—Unverified
Exponentially Weighted Imitation Learning for Batched Historical Data	Dec 1, 2018	Imitation Learningreinforcement-learning	—Unverified
Co-Imitation Learning without Expert Demonstration	Mar 27, 2021	Imitation Learning	—Unverified
Extracting Contact and Motion from Manipulation Videos	Jul 13, 2018	ClusteringImitation Learning	—Unverified
Extracting Relations between Non-Standard Entities using Distant Supervision and Imitation Learning	Sep 1, 2015	Imitation LearningInformation Retrieval	—Unverified
Extraneousness-Aware Imitation Learning	Oct 4, 2022	Imitation Learning	—Unverified
Combating False Negatives in Adversarial Imitation Learning	Feb 2, 2020	Imitation Learning	—Unverified
Extrinsicaly Rewarded Soft Q Imitation Learning with Discriminator	Jan 30, 2024	Imitation LearningMuJoCo	—Unverified
FABG : End-to-end Imitation Learning for Embodied Affective Human-Robot Interaction	Mar 3, 2025	Gesture RecognitionImitation Learning	—Unverified
Flexible and Efficient Long-Range Planning Through Curious Exploration	Apr 22, 2020	Deep Reinforcement LearningImitation Learning	—Unverified
FlowOE: Imitation Learning with Flow Policy from Ensemble RL Experts for Optimal Execution under Heston Volatility and Concave Market Impacts	Jun 6, 2025	Imitation Learning	—Unverified

Show:10 25 50

← PrevPage 26 of 85Next →

No leaderboard results yet.