Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 226–250 of 453 papers

Title	Date	Tasks	Status
Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models	Sep 23, 2024	Common Sense ReasoningSpatial Reasoning	—Unverified
Talking about the Moving Image: A Declarative Model for Image Schema Based Embodied Perception Grounding and Language Generation	Aug 13, 2015	Spatial ReasoningText Generation	—Unverified
Testing GPT-4-o1-preview on math and science problems: A follow-up study	Oct 11, 2024	MathSpatial Reasoning	—Unverified
TopV-Nav: Unlocking the Top-View Spatial Reasoning Potential of MLLM for Zero-shot Object Navigation	Nov 25, 2024	Spatial Reasoning	—Unverified
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering	Sep 21, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Towards Dynamic 3D Reconstruction of Hand-Instrument Interaction in Ophthalmic Surgery	May 23, 2025	3D ReconstructionHand Pose Estimation	—Unverified
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds	May 20, 2025	Spatial Reasoning	—Unverified
Towards Grounded Visual Spatial Reasoning in Multi-Modal Vision Language Models	Aug 18, 2023	Image-text matchingObject Localization	—Unverified
Towards Navigation by Reasoning over Spatial Configurations	May 14, 2021	Spatial Reasoning	—Unverified
Towards Visual Text Grounding of Multimodal Large Language Model	Apr 7, 2025	BenchmarkingLanguage Modeling	—Unverified
U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding	May 23, 2025	BenchmarkingSpatial Reasoning	—Unverified
UI-Vision: A Desktop-centric GUI Benchmark for Visual Perception and Interaction	Mar 19, 2025	NavigateSpatial Reasoning	—Unverified
Unifying Map and Landmark Based Representations for Visual Navigation	Dec 21, 2017	NavigateSpatial Reasoning	—Unverified
Unsupervised Representation Learning Facilitates Human-like Spatial Reasoning	Oct 12, 2021	Representation LearningSpatial Reasoning	—Unverified
Video Perception Models for 3D Scene Synthesis	Jun 25, 2025	3D ReconstructionImage Generation	—Unverified
VideoSAVi: Self-Aligned Video Language Models without Human Supervision	Dec 1, 2024	EgoSchemaMVBench	—Unverified
VisionArena: 230K Real World User-VLM Conversations with Preference Labels	Dec 11, 2024	ChatbotSpatial Reasoning	—Unverified
Vision-Integrated LLMs for Autonomous Driving Assistance : Human Performance Comparison and Trust Evaluation	Feb 6, 2025	Autonomous DrivingDecision Making	—Unverified
Visual Agentic AI for Spatial Reasoning with a Dynamic API	Feb 10, 2025	Program SynthesisSpatial Reasoning	—Unverified
VisualEchoes: Spatial Image Representation Learning through Echolocation	May 4, 2020	Depth EstimationMonocular Depth Estimation	—Unverified
Visual Embodied Brain: Let Multimodal Large Language Models See, Think, and Control in Spaces	May 30, 2025	Spatial Reasoning	—Unverified
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning	Nov 15, 2024	DescriptiveObject	—Unverified
VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge	Apr 14, 2025	Logical ReasoningMultimodal Reasoning	—Unverified
VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search	Apr 12, 2025	Spatial Reasoning	—Unverified
ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers	May 26, 2025	cross-modal alignmentPosition	—Unverified

Show:10 25 50

← PrevPage 10 of 19Next →

No leaderboard results yet.