Vision-Language-Action

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 157 papers

Title	Date	Tasks	Status
MoManipVLA: Transferring Vision-language-action Models for General Mobile Manipulation	Mar 17, 2025	Motion PlanningVision-Language-Action	—Unverified
ReBot: Scaling Robot Learning with Real-to-Sim-to-Real Robotic Video Synthesis	Mar 15, 2025	Domain GeneralizationRobot Manipulation	—Unverified
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model	Mar 13, 2025	Common Sense ReasoningDenoising	—Unverified
MoRE: Unlocking Scalability in Reinforcement Learning for Quadruped Vision-Language-Action Models	Mar 11, 2025	Large Language ModelMixture-of-Experts	—Unverified
Refined Policy Distillation: From VLA Generalists to RL Experts	Mar 6, 2025	Vision-Language-Action	—Unverified
OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction	Mar 5, 2025	Vision-Language-ActionZero-shot Generalization	—Unverified
SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Constrained Learning	Mar 5, 2025	Safe Reinforcement LearningSafety Alignment	—Unverified
Accelerating Vision-Language-Action Model Integrated with Action Chunking via Parallel Decoding	Mar 4, 2025	ChunkingVision-Language-Action	—Unverified
A Taxonomy for Evaluating Generalist Robot Policies	Mar 3, 2025	Robot ManipulationVision-Language-Action	—Unverified
DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping	Feb 28, 2025	Imitation LearningVision-Language-Action	—Unverified
ObjectVLA: End-to-End Open-World Object Manipulation Without Demonstration	Feb 26, 2025	Imitation LearningObject	—Unverified
Hi Robot: Open-Ended Instruction Following with Hierarchical Vision-Language-Action Models	Feb 26, 2025	Instruction FollowingVision-Language-Action	—Unverified
Evolution 6.0: Evolving Robotic Capabilities Through Generative Design	Feb 24, 2025	Action GenerationText to 3D	—Unverified
GEVRM: Goal-Expressive Video Generation Model For Robust Visual Manipulation	Feb 13, 2025	Contrastive LearningVideo Generation	—Unverified
HAMSTER: Hierarchical Action Models For Open-World Robot Manipulation	Feb 8, 2025	Robot ManipulationVision-Language-Action	—Unverified
Survey on Vision-Language-Action Models	Feb 7, 2025	Review GenerationSurvey	—Unverified
Probing a Vision-Language-Action Model for Symbolic States and Integration into a Cognitive Architecture	Feb 6, 2025	ObjectVision-Language-Action	—Unverified
VLA-Cache: Towards Efficient Vision-Language-Action Model via Adaptive Token Caching in Robotic Manipulation	Feb 4, 2025	Decision MakingSequential Decision Making	—Unverified
UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent	Jan 31, 2025	Robot ManipulationVision-Language-Action	—Unverified
Improving Vision-Language-Action Model with Online Reinforcement Learning	Jan 28, 2025	reinforcement-learningReinforcement Learning	—Unverified
FAST: Efficient Action Tokenization for Vision-Language-Action Models	Jan 16, 2025	Vision-Language-Action	—Unverified
Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding	Jan 8, 2025	Robot ManipulationText Generation	—Unverified
Large language models for artificial general intelligence (AGI): A survey of foundational principles and approaches	Jan 6, 2025	Vision-Language-Action	—Unverified
Object-Centric Prompt-Driven Vision-Language-Action Model for Robotic Manipulation	Jan 1, 2025	Vision-Language-Action	—Unverified
SOLAMI: Social Vision-Language-Action Modeling for Immersive Interaction with 3D Autonomous Characters	Jan 1, 2025	Vision-Language-Action	—Unverified
VLABench: A Large-Scale Benchmark for Language-Conditioned Robotics Manipulation with Long-Horizon Reasoning Tasks	Dec 24, 2024	Common Sense ReasoningTransfer Learning	—Unverified
QUART-Online: Latency-Free Large Multimodal Language Model for Quadruped Robot Learning	Dec 20, 2024	Language ModelingLanguage Modelling	—Unverified
RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation	Dec 18, 2024	DiversityImitation Learning	—Unverified
Modality-Driven Design for Multi-Step Dexterous Manipulation: Insights from Neuroscience	Dec 15, 2024	Vision-Language-Action	—Unverified
TraceVLA: Visual Trace Prompting Enhances Spatial-Temporal Awareness for Generalist Robotic Policies	Dec 13, 2024	Robot ManipulationVision-Language-Action	—Unverified
Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks	Dec 9, 2024	Vision-Language-Action	—Unverified
NaVILA: Legged Robot Vision-Language-Action Model for Navigation	Dec 5, 2024	NavigateVision and Language Navigation	—Unverified
Quantization-Aware Imitation-Learning for Resource-Efficient Robotic Control	Dec 2, 2024	Autonomous DrivingDecision Making	—Unverified
CogACT: A Foundational Vision-Language-Action Model for Synergizing Cognition and Action in Robotic Manipulation	Nov 29, 2024	QuantizationVision-Language-Action	—Unverified
GRAPE: Generalizing Robot Policy via Preference Alignment	Nov 28, 2024	Vision-Language-Action	—Unverified
π_0: A Vision-Language-Action Flow Model for General Robot Control	Oct 31, 2024	Language ModelingLanguage Modelling	—Unverified
A Dual Process VLA: Efficient Robotic Manipulation Leveraging VLM	Oct 21, 2024	Decision MakingVision-Language-Action	—Unverified
Vision-Language-Action Model and Diffusion Policy Switching Enables Dexterous Control of an Anthropomorphic Hand	Oct 17, 2024	Vision-Language-Action	—Unverified
Towards Synergistic, Generalized, and Efficient Dual-System for Robotic Manipulation	Oct 10, 2024	Robot ManipulationVision-Language-Action	—Unverified
LADEV: A Language-Driven Testing and Evaluation Platform for Vision-Language-Action Models in Robotic Manipulation	Oct 7, 2024	Vision-Language-Action	—Unverified
Run-time Observation Interventions Make Vision-Language-Action Models More Visually Robust	Oct 2, 2024	Vision-Language-Action	—Unverified
ReVLA: Reverting Visual Domain Limitation of Robotic Foundation Models	Sep 23, 2024	Vision-Language-Action	—Unverified
Manipulation Facing Threats: Evaluating Physical Vulnerabilities in End-to-End Vision Language Action Models	Sep 20, 2024	Vision-Language-Action	—Unverified
HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers	Sep 12, 2024	Vision-Language-Action	—Unverified
OccLLaMA: An Occupancy-Language-Action Generative World Model for Autonomous Driving	Sep 5, 2024	Autonomous DrivingMotion Planning	—Unverified
CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving	Aug 19, 2024	Autonomous DrivingCaption Generation	—Unverified
Robotic Control via Embodied Chain-of-Thought Reasoning	Jul 11, 2024	Vision-Language-Action	—Unverified
Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs	Jul 10, 2024	Common Sense ReasoningVision-Language-Action	—Unverified
OmniJARVIS: Unified Vision-Language-Action Tokenization Enables Open-World Instruction Following Agents	Jun 27, 2024	DecoderImitation Learning	—Unverified
Towards Natural Language-Driven Assembly Using Foundation Models	Jun 23, 2024	FrictionVision-Language-Action	—Unverified

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.