Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 453 papers

Title	Date	Tasks	Status	Hype
Towards Dynamic 3D Reconstruction of Hand-Instrument Interaction in Ophthalmic Surgery	May 23, 2025	3D ReconstructionHand Pose Estimation	—Unverified	0
Knot So Simple: A Minimalistic Environment for Spatial Reasoning	May 23, 2025	Model Predictive ControlSpatial Reasoning	CodeCode Available	1
DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?	May 22, 2025	AttributeSpatial Reasoning	—Unverified	0
Bridging the Dynamic Perception Gap: Training-Free Draft Chain-of-Thought for Dynamic Multimodal Spatial Reasoning	May 22, 2025	Spatial Reasoning	CodeCode Available	0
MEgoHand: Multimodal Egocentric Hand-Object Interaction Motion Generation	May 22, 2025	Motion GenerationObject	—Unverified	0
SPaRC: A Spatial Pathfinding Reasoning Challenge	May 22, 2025	Spatial Reasoning	CodeCode Available	0
VLM-R^3: Region Recognition, Reasoning, and Refinement for Enhanced Multimodal Chain-of-Thought	May 22, 2025	Spatial Reasoning	—Unverified	0
MMMR: Benchmarking Massive Multi-Modal Reasoning Tasks	May 22, 2025	BenchmarkingSpatial Reasoning	—Unverified	0
SpatialScore: Towards Unified Evaluation for Multimodal Spatial Understanding	May 22, 2025	Motion EstimationQuestion Answering	CodeCode Available	2
CoNav: Collaborative Cross-Modal Reasoning for Embodied Navigation	May 22, 2025	Scene UnderstandingSpatial Reasoning	CodeCode Available	1
SEM: Enhancing Spatial Understanding for Robust Robot Manipulation	May 22, 2025	3D geometryRobot Manipulation	—Unverified	0
GoT-R1: Unleashing Reasoning Capability of MLLM for Visual Generation with Reinforcement Learning	May 22, 2025	AttributeImage Generation	CodeCode Available	2
SPhyR: Spatial-Physical Reasoning Benchmark on Material Distribution	May 21, 2025	Spatial Reasoning	CodeCode Available	0
STAR-R1: Spacial TrAnsformation Reasoning by Reinforcing Multimodal LLMs	May 21, 2025	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	0
ReGUIDE: Data Efficient GUI Grounding via Spatial Reasoning and Search	May 21, 2025	Spatial Reasoning	—Unverified	0
From Templates to Natural Language: Generalization Challenges in Instruction-Tuned LLMs for Spatial Reasoning	May 20, 2025	Spatial Reasoning	—Unverified	0
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds	May 20, 2025	Spatial Reasoning	—Unverified	0
Incentivizing Multimodal Reasoning in Large Models for Direct Robot Manipulation	May 19, 2025	Multimodal ReasoningRobot Manipulation	—Unverified	0
Visuospatial Cognitive Assistant	May 18, 2025	Spatial Reasoning	CodeCode Available	1
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning	May 18, 2025	Knowledge DistillationSpatial Reasoning	—Unverified	0
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind	May 18, 2025	BenchmarkingScene Understanding	—Unverified	0
Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts	May 18, 2025	Spatial Reasoning	CodeCode Available	1
Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning?	May 17, 2025	HallucinationObject Counting	—Unverified	0
PRS-Med: Position Reasoning Segmentation with Vision-Language Model in Medical Imaging	May 17, 2025	Image SegmentationLanguage Modeling	—Unverified	0
A Light and Smart Wearable Platform with Multimodal Foundation Model for Enhanced Spatial Reasoning in People with Blindness and Low Vision	May 16, 2025	Large Language ModelNavigate	—Unverified	0

Show:10 25 50

← PrevPage 3 of 19Next →

No leaderboard results yet.