Imitation Learning

Imitation Learning is a framework for learning a behavior policy from demonstrations. Usually, demonstrations are presented in the form of state-action trajectories, with each pair indicating the action to take at the state being visited. In order to learn the behavior policy, the demonstrated actions are usually utilized in two ways. The first, known as Behavior Cloning (BC), treats the action as the target label for each state, and then learns a generalized mapping from states to actions in a supervised manner. Another way, known as Inverse Reinforcement Learning (IRL), views the demonstrated actions as a sequence of decisions, and aims at finding a reward/cost function under which the demonstrated decisions are optimal.

Finally, a newer methodology, Inverse Q-Learning aims at directly learning Q-functions from expert data, implicitly representing rewards, under which the optimal policy can be given as a Boltzmann distribution similar to soft Q-learning

Source: Learning to Imitate

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 2122 papers

Title	Date	Tasks	Status
Learning for Long-Horizon Planning via Neuro-Symbolic Abductive Imitation	Nov 27, 2024	Imitation LearningLogical Reasoning	CodeCode Available
Prediction with Action: Visual Policy Learning via Joint Denoising Process	Nov 27, 2024	DenoisingImage Generation	—Unverified
G3Flow: Generative 3D Semantic Flow for Pose-aware and Generalizable Object Manipulation	Nov 27, 2024	Imitation LearningObject	CodeCode Available
Spatially Visual Perception for End-to-End Robotic Learning	Nov 26, 2024	Depth EstimationImage Augmentation	—Unverified
Self-reconfiguration Strategies for Space-distributed Spacecraft	Nov 26, 2024	Imitation Learning	—Unverified
LHPF: Look back the History and Plan for the Future in Autonomous Driving	Nov 26, 2024	Autonomous DrivingDecision Making	—Unverified
RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations	Nov 25, 2024	counterfactualData Augmentation	—Unverified
End-to-End Steering for Autonomous Vehicles via Conditional Imitation Co-Learning	Nov 25, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
WildLMa: Long Horizon Loco-Manipulation in the Wild	Nov 22, 2024	Imitation Learning	—Unverified
Instant Policy: In-Context Imitation Learning via Graph Diffusion	Nov 19, 2024	Graph GenerationImitation Learning	—Unverified
Error-Feedback Model for Output Correction in Bilateral Control-Based Imitation Learning	Nov 19, 2024	Imitation Learning	—Unverified
Bridging the Resource Gap: Deploying Advanced Imitation Learning Models onto Affordable Embedded Platforms	Nov 18, 2024	Imitation LearningModel Compression	—Unverified
Off-Dynamics Reinforcement Learning via Domain Adaptation and Reward Augmented Imitation	Nov 15, 2024	Domain AdaptationImitation Learning	CodeCode Available
Learning Generalizable 3D Manipulation With 10 Demonstrations	Nov 15, 2024	DenoisingImitation Learning	CodeCode Available
Approximated Variational Bayesian Inverse Reinforcement Learning for Large Language Model Alignment	Nov 14, 2024	BIRLImitation Learning	—Unverified
Robot See, Robot Do: Imitation Reward for Noisy Financial Environments	Nov 13, 2024	Decision MakingImitation Learning	—Unverified
Imitation Learning from Observations: An Autoregressive Mixture of Experts Approach	Nov 12, 2024	Autonomous DrivingImitation Learning	—Unverified
Learning Memory Mechanisms for Decision Making through Demonstrations	Nov 12, 2024	Decision MakingImitation Learning	CodeCode Available
Navigation with QPHIL: Quantizing Planner for Hierarchical Implicit Q-Learning	Nov 12, 2024	Imitation LearningOffline RL	—Unverified
EMPERROR: A Flexible Generative Perception Error Model for Probing Self-Driving Planners	Nov 12, 2024	Imitation Learning	—Unverified
Identifying Differential Patient Care Through Inverse Intent Inference	Nov 11, 2024	counterfactualImitation Learning	—Unverified
Imitation from Diverse Behaviors: Wasserstein Quality Diversity Imitation Learning with Single-Step Archive Exploration	Nov 11, 2024	continuous-controlContinuous Control	—Unverified
Scaling Laws for Pre-training Agents and World Models	Nov 7, 2024	Imitation LearningLanguage Modeling	—Unverified
ET-SEED: Efficient Trajectory-Level SE(3) Equivariant Diffusion Policy	Nov 6, 2024	Imitation LearningRobot Manipulation	—Unverified
Object and Contact Point Tracking in Demonstrations Using 3D Gaussian Splatting	Nov 5, 2024	Imitation LearningPoint Tracking	—Unverified
Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy for Visuomotor Imitation Learning	Nov 5, 2024	Continual LearningImitation Learning	—Unverified
So You Think You Can Scale Up Autonomous Robot Data Collection?	Nov 4, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
Efficient Active Imitation Learning with Random Network Distillation	Nov 4, 2024	Imitation Learning	—Unverified
Safe Imitation Learning-based Optimal Energy Storage Systems Dispatch in Distribution Networks	Nov 1, 2024	Deep Reinforcement LearningImitation Learning	—Unverified
DexMimicGen: Automated Data Generation for Bimanual Dexterous Manipulation via Imitation Learning	Oct 31, 2024	Imitation Learning	—Unverified
State- and context-dependent robotic manipulation and grasping via uncertainty-aware imitation learning	Oct 31, 2024	Imitation LearningUncertainty Quantification	—Unverified
Rethinking Inverse Reinforcement Learning: from Data Alignment to Task Alignment	Oct 31, 2024	Imitation LearningTransfer Learning	CodeCode Available
3D-ViTac: Learning Fine-Grained Manipulation with Visuo-Tactile Sensing	Oct 31, 2024	Imitation Learning	—Unverified
Keypoint Abstraction using Large Models for Object-Relative Imitation Learning	Oct 30, 2024	Imitation LearningObject	—Unverified
SoftCTRL: Soft conservative KL-control of Transformer Reinforcement Learning for Autonomous Driving	Oct 30, 2024	Autonomous DrivingImitation Learning	—Unverified
Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation	Oct 30, 2024	Imitation LearningIncremental Learning	—Unverified
Precise and Dexterous Robotic Manipulation via Human-in-the-Loop Reinforcement Learning	Oct 29, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
Deploying Ten Thousand Robots: Scalable Imitation Learning for Lifelong Multi-Agent Path Finding	Oct 28, 2024	Imitation LearningMulti-Agent Path Finding	—Unverified
Identifying Selections for Unsupervised Subtask Discovery	Oct 28, 2024	Imitation Learning	—Unverified
Unveiling the Role of Expert Guidance: A Comparative Analysis of User-centered Imitation Learning and Traditional Reinforcement Learning	Oct 28, 2024	Imitation LearningUnity	—Unverified
GHIL-Glue: Hierarchical Control with Filtered Subgoal Images	Oct 26, 2024	Imitation LearningVideo Prediction	—Unverified
MILES: Making Imitation Learning Easy with Self-Supervision	Oct 25, 2024	Contact-rich ManipulationImitation Learning	—Unverified
SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment	Oct 24, 2024	Imitation LearningMotion Planning	—Unverified
SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation	Oct 23, 2024	Imitation LearningMotion Planning	—Unverified
Diverse Policies Recovering via Pointwise Mutual Information Weighted Imitation Learning	Oct 21, 2024	Imitation Learning	—Unverified
Latent Weight Diffusion: Generating reactive policies instead of trajectories	Oct 17, 2024	DenoisingImitation Learning	—Unverified
DDIL: Diversity Enhancing Diffusion Distillation With Imitation Learning	Oct 15, 2024	DenoisingDiversity	—Unverified
ILAEDA: An Imitation Learning Based Approach for Automatic Exploratory Data Analysis	Oct 15, 2024	Imitation LearningReinforcement Learning (RL)	—Unverified
How to Leverage Demonstration Data in Alignment for Large Language Model? A Self-Imitation Learning Perspective	Oct 14, 2024	Density Ratio EstimationGSM8K	CodeCode Available
Conformalized Interactive Imitation Learning: Handling Expert Shift and Intermittent Feedback	Oct 11, 2024	Conformal PredictionImitation Learning	—Unverified

Show:10 25 50

← PrevPage 13 of 43Next →

No leaderboard results yet.