Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–200 of 453 papers

Title	Date	Tasks	Status
MEgoHand: Multimodal Egocentric Hand-Object Interaction Motion Generation	May 22, 2025	Motion GenerationObject	—Unverified
VLM-R^3: Region Recognition, Reasoning, and Refinement for Enhanced Multimodal Chain-of-Thought	May 22, 2025	Spatial Reasoning	—Unverified
DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?	May 22, 2025	AttributeSpatial Reasoning	—Unverified
SEM: Enhancing Spatial Understanding for Robust Robot Manipulation	May 22, 2025	3D geometryRobot Manipulation	—Unverified
SPaRC: A Spatial Pathfinding Reasoning Challenge	May 22, 2025	Spatial Reasoning	CodeCode Available
MMMR: Benchmarking Massive Multi-Modal Reasoning Tasks	May 22, 2025	BenchmarkingSpatial Reasoning	—Unverified
STAR-R1: Spacial TrAnsformation Reasoning by Reinforcing Multimodal LLMs	May 21, 2025	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available
ReGUIDE: Data Efficient GUI Grounding via Spatial Reasoning and Search	May 21, 2025	Spatial Reasoning	—Unverified
SPhyR: Spatial-Physical Reasoning Benchmark on Material Distribution	May 21, 2025	Spatial Reasoning	CodeCode Available
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds	May 20, 2025	Spatial Reasoning	—Unverified
From Templates to Natural Language: Generalization Challenges in Instruction-Tuned LLMs for Spatial Reasoning	May 20, 2025	Spatial Reasoning	—Unverified
Incentivizing Multimodal Reasoning in Large Models for Direct Robot Manipulation	May 19, 2025	Multimodal ReasoningRobot Manipulation	—Unverified
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning	May 18, 2025	Knowledge DistillationSpatial Reasoning	—Unverified
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind	May 18, 2025	BenchmarkingScene Understanding	—Unverified
Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning?	May 17, 2025	HallucinationObject Counting	—Unverified
PRS-Med: Position Reasoning Segmentation with Vision-Language Model in Medical Imaging	May 17, 2025	Image SegmentationLanguage Modeling	—Unverified
A Light and Smart Wearable Platform with Multimodal Foundation Model for Enhanced Spatial Reasoning in People with Blindness and Low Vision	May 16, 2025	Large Language ModelNavigate	—Unverified
SpatialPrompting: Keyframe-driven Zero-Shot Spatial Reasoning with Off-the-Shelf Multimodal Large Language Models	May 8, 2025	Spatial Reasoning	—Unverified
SITE: towards Spatial Intelligence Thorough Evaluation	May 8, 2025	Question AnsweringSpatial Reasoning	—Unverified
Preliminary Explorations with GPT-4o(mni) Native Image Generation	May 6, 2025	Image Generationmultimodal generation	—Unverified
Beyond Recognition: Evaluating Visual Perspective Taking in Vision Language Models	May 3, 2025	DiagnosticObject Recognition	—Unverified
FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors	May 2, 2025	ObjectSpatial Reasoning	—Unverified
SpatialLLM: A Compound 3D-Informed Design towards Spatially-Intelligent Large Multimodal Models	May 1, 2025	Spatial ReasoningVisual Question Answering (VQA)	—Unverified
First Order Logic with Fuzzy Semantics for Describing and Recognizing Nerves in Medical Images	Apr 30, 2025	Spatial Reasoning	—Unverified
SpatialReasoner: Towards Explicit and Generalizable 3D Spatial Reasoning	Apr 28, 2025	Question AnsweringSpatial Reasoning	—Unverified

Show:10 25 50

← PrevPage 8 of 19Next →

No leaderboard results yet.