Imitation Learning

Imitation Learning is a framework for learning a behavior policy from demonstrations. Usually, demonstrations are presented in the form of state-action trajectories, with each pair indicating the action to take at the state being visited. In order to learn the behavior policy, the demonstrated actions are usually utilized in two ways. The first, known as Behavior Cloning (BC), treats the action as the target label for each state, and then learns a generalized mapping from states to actions in a supervised manner. Another way, known as Inverse Reinforcement Learning (IRL), views the demonstrated actions as a sequence of decisions, and aims at finding a reward/cost function under which the demonstrated decisions are optimal.

Finally, a newer methodology, Inverse Q-Learning aims at directly learning Q-functions from expert data, implicitly representing rewards, under which the optimal policy can be given as a Boltzmann distribution similar to soft Q-learning

Source: Learning to Imitate

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 2122 papers

Title	Date	Tasks	Status
A Dual Approach to Imitation Learning from Observations with Offline Datasets	Jun 13, 2024	Imitation LearningOffline RL	—Unverified
RILe: Reinforced Imitation Learning	Jun 12, 2024	Computational EfficiencyImitation Learning	—Unverified
Online Adaptation for Enhancing Imitation Learning Policies	Jun 7, 2024	Imitation Learning	CodeCode Available
Behavior-Targeted Attack on Reinforcement Learning with Limited Access to Victim's Policy	Jun 6, 2024	Imitation Learningreinforcement-learning	—Unverified
Phase-Amplitude Reduction-Based Imitation Learning	Jun 6, 2024	Imitation Learning	CodeCode Available
Aligning Agents like Large Language Models	Jun 6, 2024	Imitation Learning	—Unverified
Multi-Agent Imitation Learning: Value is Easy, Regret is Hard	Jun 6, 2024	counterfactualImitation Learning	—Unverified
Adversarial Moment-Matching Distillation of Large Language Models	Jun 5, 2024	Imitation LearningInstruction Following	CodeCode Available
RoboCasa: Large-Scale Simulation of Everyday Tasks for Generalist Robots	Jun 4, 2024	Imitation LearningText to 3D	—Unverified
MOT: A Mixture of Actors Reinforcement Learning Method by Optimal Transport for Algorithmic Trading	Jun 3, 2024	Algorithmic TradingImitation Learning	—Unverified
Validity Learning on Failures: Mitigating the Distribution Shift in Autonomous Vehicle Planning	Jun 3, 2024	Autonomous DrivingBench2Drive	—Unverified
Beyond Imitation: Learning Key Reasoning Steps from Dual Chain-of-Thoughts in Reasoning Distillation	May 30, 2024	Imitation Learning	CodeCode Available
From Words to Actions: Unveiling the Theoretical Underpinnings of LLM-Driven Autonomous Systems	May 30, 2024	Decision MakingHierarchical Reinforcement Learning	—Unverified
Inverse Concave-Utility Reinforcement Learning is Inverse Game Theory	May 29, 2024	Imitation LearningOffline RL	—Unverified
Imitating from auxiliary imperfect demonstrations via Adversarial Density Weighted Regression	May 28, 2024	Imitation LearningMuJoCo	CodeCode Available
Vision-and-Language Navigation Generative Pretrained Transformer	May 27, 2024	DecoderImitation Learning	—Unverified
Multi-Agent Inverse Reinforcement Learning in Real World Unstructured Pedestrian Crowds	May 26, 2024	Imitation LearningMotion Planning	—Unverified
Provably Efficient Off-Policy Adversarial Imitation Learning with Convergence Guarantees	May 26, 2024	Imitation Learning	—Unverified
Diffusion-Reward Adversarial Imitation Learning	May 25, 2024	Imitation Learning	—Unverified
Amortized nonmyopic active search via deep imitation learning	May 23, 2024	Active LearningImitation Learning	—Unverified
Efficient Imitation Learning with Conservative World Models	May 21, 2024	Imitation LearningOffline RL	—Unverified
RuleFuser: An Evidential Bayes Approach for Rule Injection in Imitation Learned Planners and Predictors for Robustness under Distribution Shifts	May 18, 2024	Autonomous DrivingImitation Learning	—Unverified
Decision Mamba Architectures	May 13, 2024	D4RLImitation Learning	CodeCode Available
Reducing Risk for Assistive Reinforcement Learning Policies with Diffusion Models	May 13, 2024	Imitation Learningreinforcement-learning	—Unverified
ExACT: An End-to-End Autonomous Excavator System Using Action Chunking With Transformers	May 9, 2024	ChunkingImitation Learning	—Unverified
Ranking-based Client Selection with Imitation Learning for Efficient Federated Learning	May 7, 2024	Federated LearningImitation Learning	—Unverified
Robotic Constrained Imitation Learning for the Peg Transfer Task in Fundamentals of Laparoscopic Surgery	May 6, 2024	Imitation Learning	—Unverified
VectorPainter: Advanced Stylized Vector Graphics Synthesis Using Stroke-Style Priors	May 5, 2024	Imitation LearningVector Graphics	—Unverified
Sub-goal Distillation: A Method to Improve Small Language Agents	May 4, 2024	Imitation LearningKnowledge Distillation	CodeCode Available
Imitation Learning in Discounted Linear MDPs without exploration assumptions	May 3, 2024	Imitation Learning	—Unverified
IntervenGen: Interventional Data Generation for Robust and Data-Efficient Robot Imitation Learning	May 2, 2024	Imitation LearningPose Estimation	—Unverified
Continual Learning from Simulated Interactions via Multitask Prospective Rehearsal for Bionic Limb Behavior Modeling	May 2, 2024	Continual LearningImitation Learning	—Unverified
CGD: Constraint-Guided Diffusion Policies for UAV Trajectory Planning	May 2, 2024	Imitation LearningTrajectory Planning	—Unverified
Guiding Attention in End-to-End Driving Models	Apr 30, 2024	Autonomous DrivingImitation Learning	CodeCode Available
A Survey of Imitation Learning Methods, Environments and Metrics	Apr 30, 2024	Imitation LearningSurvey	—Unverified
Overcoming Knowledge Barriers: Online Imitation Learning from Observation with Pretrained World Models	Apr 29, 2024	Decision MakingImitation Learning	CodeCode Available
Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods	Apr 25, 2024	Imitation Learning	—Unverified
Benchmarking Mobile Device Control Agents across Diverse Configurations	Apr 25, 2024	BenchmarkingImitation Learning	—Unverified
IDIL: Imitation Learning of Intent-Driven Expert Behavior	Apr 25, 2024	Imitation Learning	—Unverified
LLM-Personalize: Aligning LLM Planners with Human Preferences via Reinforced Self-Training for Housekeeping Robots	Apr 22, 2024	Imitation LearningTask Planning	—Unverified
A survey of air combat behavior modeling using machine learning	Apr 22, 2024	Imitation LearningSurvey	—Unverified
Augmenting Safety-Critical Driving Scenarios while Preserving Similarity to Expert Trajectories	Apr 20, 2024	Imitation Learning	—Unverified
Bootstrapping Linear Models for Fast Online Adaptation in Human-Agent Collaboration	Apr 16, 2024	Human Agent CollaborationImitation Learning	CodeCode Available
Unveiling Imitation Learning: Exploring the Impact of Data Falsity to Large Language Model	Apr 15, 2024	Imitation LearningLanguage Modeling	—Unverified
Adversarial Imitation Learning via Boosting	Apr 12, 2024	Imitation Learning	—Unverified
AdaDemo: Data-Efficient Demonstration Expansion for Generalist Robotic Agent	Apr 11, 2024	Imitation Learning	—Unverified
Reward Learning from Suboptimal Demonstrations with Applications in Surgical Electrocautery	Apr 10, 2024	Decision MakingImitation Learning	—Unverified
SAFE-GIL: SAFEty Guided Imitation Learning for Robotic Systems	Apr 8, 2024	Autonomous NavigationImitation Learning	—Unverified
CNN-based Game State Detection for a Foosball Table	Apr 8, 2024	Deep Reinforcement LearningImitation Learning	—Unverified
Prompting Multi-Modal Tokens to Enhance End-to-End Autonomous Driving Imitation Learning with LLMs	Apr 7, 2024	Autonomous DrivingImitation Learning	—Unverified

Show:10 25 50

← PrevPage 16 of 43Next →

No leaderboard results yet.