Vision-Language-Action

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 157 papers

Title	Date	Tasks	Status
ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation	May 28, 2025	Contact-rich ManipulationMixture-of-Experts	—Unverified
Hume: Introducing System-2 Thinking in Visual-Language-Action Model	May 27, 2025	DenoisingVision-Language-Action	—Unverified
Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review	May 26, 2025	Decision Making Under UncertaintySensor Fusion	—Unverified
What Can RL Bring to VLA Generalization? An Empirical Study	May 26, 2025	Reinforcement Learning (RL)Vision-Language-Action	—Unverified
BadVLA: Towards Backdoor Attacks on Vision-Language-Action Models via Objective-Decoupled Optimization	May 22, 2025	Backdoor AttackVision-Language-Action	—Unverified
Interactive Post-Training for Vision-Language-Action Models	May 22, 2025	Vision-Language-Action	—Unverified
DriveMoE: Mixture-of-Experts for Vision-Language-Action Model in End-to-End Autonomous Driving	May 22, 2025	Autonomous DrivingBench2Drive	—Unverified
Perceptual Quality Assessment for Embodied AI	May 22, 2025	Image Quality AssessmentVision-Language-Action	CodeCode Available
Object-Focus Actor for Data-efficient Robot Generalization Dexterous Manipulation	May 21, 2025	ObjectPose Estimation	—Unverified
EndoVLA: Dual-Phase Vision-Language-Action Model for Autonomous Tracking in Endoscopy	May 21, 2025	Motion PlanningVision-Language-Action	—Unverified
FLARE: Robot Learning with Implicit World Modeling	May 21, 2025	Imitation LearningVision-Language-Action	—Unverified
Conditioning Matters: Training Diffusion Policies is Faster Than You Think	May 16, 2025	Vision-Language-Action	—Unverified
RT-cache: Efficient Robot Trajectory Retrieval System	May 14, 2025	RetrievalVision-Language-Action	—Unverified
Pixel Motion as Universal Representation for Robot Control	May 12, 2025	Vision-Language-Action	—Unverified
3D CAVLA: Leveraging Depth and 3D Context to Generalize Vision Language Action Models for Unseen Tasks	May 9, 2025	Vision-Language-Action	—Unverified
Vision-Language-Action Models: Concepts, Progress, Applications and Challenges	May 7, 2025	Autonomous VehiclesNatural Language Understanding	—Unverified
Automated Data Curation Using GPS & NLP to Generate Instruction-Action Pairs for Autonomous Vehicle Vision-Language Navigation Datasets	May 6, 2025	Autonomous VehiclesTAG	—Unverified
NORA: A Small Open-Sourced Generalist Vision Language Action Model for Embodied Tasks	Apr 28, 2025	Task PlanningVision-Language-Action	—Unverified
π_0.5: a Vision-Language-Action Model with Open-World Generalization	Apr 22, 2025	Transfer LearningVision-Language-Action	—Unverified
OPAL: Encoding Causal Understanding of Physical Systems for Robot Learning	Apr 9, 2025	Vision-Language-Action	—Unverified
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning	Apr 1, 2025	Reinforcement Learning (RL)Vision-Language-Action	—Unverified
CoT-VLA: Visual Chain-of-Thought Reasoning for Vision-Language-Action Models	Mar 27, 2025	Vision-Language-Action	—Unverified
MoLe-VLA: Dynamic Layer-skipping Vision Language Action Model via Mixture-of-Layers for Efficient Robot Manipulation	Mar 26, 2025	Knowledge DistillationMixture-of-Experts	—Unverified
DataPlatter: Boosting Robotic Manipulation Generalization with Minimal Costly Data	Mar 25, 2025	Robot ManipulationSpatial Reasoning	—Unverified
GR00T N1: An Open Foundation Model for Generalist Humanoid Robots	Mar 18, 2025	Imitation LearningVision-Language-Action	—Unverified

Show:10 25 50

← PrevPage 4 of 7Next →

No leaderboard results yet.