Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 453 papers

Title	Date	Tasks	Status
SPARTUN3D: Situated Spatial Understanding of 3D World in Large Language Models	Oct 4, 2024	Scene UnderstandingSpatial Reasoning	—Unverified
Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Mutimodal Models	Jan 1, 2025	AttributeDiagnostic	—Unverified
SpatialCLIP: Learning 3D-aware Image Representations from Spatially Discriminative Language	Jan 1, 2025	Spatial Reasoning	—Unverified
SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning	Jan 17, 2025	Spatial ReasoningTask Planning	—Unverified
Spatial Intelligence of a Self-driving Car and Rule-Based Decision Making	Aug 2, 2023	Autonomous DrivingDecision Making	—Unverified
SpatialLLM: A Compound 3D-Informed Design towards Spatially-Intelligent Large Multimodal Models	May 1, 2025	Spatial ReasoningVisual Question Answering (VQA)	—Unverified
Spatial-MLLM: Boosting MLLM Capabilities in Visual-based Spatial Intelligence	May 29, 2025	Spatial Reasoning	—Unverified
SpatialPrompting: Keyframe-driven Zero-Shot Spatial Reasoning with Off-the-Shelf Multimodal Large Language Models	May 8, 2025	Spatial Reasoning	—Unverified
Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Geospatial Reasoning Questions	Feb 4, 2025	Question AnsweringRAG	—Unverified
Spatial Reasoner: A 3D Inference Pipeline for XR Applications	Apr 25, 2025	Spatial Reasoning	—Unverified
SpatialReasoner: Towards Explicit and Generalizable 3D Spatial Reasoning	Apr 28, 2025	Question AnsweringSpatial Reasoning	—Unverified
Spatial Reasoning and Planning for Deep Embodied Agents	Sep 28, 2024	Autonomous DrivingMinecraft	—Unverified
Spatial Reasoning for Few-Shot Object Detection	Nov 2, 2022	Data AugmentationFew-Shot Object Detection	—Unverified
Spatial Reasoning from Natural Language Instructions for Robot Manipulation	Dec 26, 2020	Robot ManipulationSpatial Reasoning	—Unverified
SpatialRGPT: Grounded Spatial Reasoning in Vision Language Models	Jun 3, 2024	Language ModellingSpatial Reasoning	—Unverified
Spatial Symmetry Driven Pruning Strategies for Efficient Declarative Spatial Reasoning	Jun 16, 2015	Spatial Reasoning	—Unverified
SpatialVLM: Endowing Vision-Language Models with Spatial Reasoning Capabilities	Jan 22, 2024	Question AnsweringSpatial Reasoning	—Unverified
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning	May 18, 2025	Knowledge DistillationSpatial Reasoning	—Unverified
Stacked Latent Attention for Multimodal Reasoning	Jun 1, 2018	Image CaptioningMultimodal Reasoning	—Unverified
StarCraftImage: A Dataset For Prototyping Spatial Reasoning Methods For Multi-Agent Environments	Jan 9, 2024	ImputationReinforcement Learning (RL)	—Unverified
Statistical applications of the 20/60/20 rule in risk management and portfolio optimization	Mar 19, 2025	ManagementPortfolio Optimization	—Unverified
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning	Feb 14, 2025	Decision MakingSpatial Reasoning	—Unverified
Stride and Translation Invariance in CNNs	Mar 18, 2021	Data Augmentationimage-classification	—Unverified
Structured Spatial Reasoning with Open Vocabulary Object Detectors	Oct 9, 2024	ObjectObject Rearrangement	—Unverified
ST-VLM: Kinematic Instruction Tuning for Spatio-Temporal Reasoning in Vision-Language Models	Mar 25, 2025	4D reconstructionAutonomous Driving	—Unverified
Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models	Sep 23, 2024	Common Sense ReasoningSpatial Reasoning	—Unverified
Talking about the Moving Image: A Declarative Model for Image Schema Based Embodied Perception Grounding and Language Generation	Aug 13, 2015	Spatial ReasoningText Generation	—Unverified
Testing GPT-4-o1-preview on math and science problems: A follow-up study	Oct 11, 2024	MathSpatial Reasoning	—Unverified
TopV-Nav: Unlocking the Top-View Spatial Reasoning Potential of MLLM for Zero-shot Object Navigation	Nov 25, 2024	Spatial Reasoning	—Unverified
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question Answering	Sep 21, 2022	Image CaptioningOptical Character Recognition (OCR)	—Unverified
Towards Dynamic 3D Reconstruction of Hand-Instrument Interaction in Ophthalmic Surgery	May 23, 2025	3D ReconstructionHand Pose Estimation	—Unverified
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds	May 20, 2025	Spatial Reasoning	—Unverified
Towards Grounded Visual Spatial Reasoning in Multi-Modal Vision Language Models	Aug 18, 2023	Image-text matchingObject Localization	—Unverified
Towards Navigation by Reasoning over Spatial Configurations	May 14, 2021	Spatial Reasoning	—Unverified
Towards Visual Text Grounding of Multimodal Large Language Model	Apr 7, 2025	BenchmarkingLanguage Modeling	—Unverified
U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding	May 23, 2025	BenchmarkingSpatial Reasoning	—Unverified
UI-Vision: A Desktop-centric GUI Benchmark for Visual Perception and Interaction	Mar 19, 2025	NavigateSpatial Reasoning	—Unverified
Unifying Map and Landmark Based Representations for Visual Navigation	Dec 21, 2017	NavigateSpatial Reasoning	—Unverified
Unsupervised Representation Learning Facilitates Human-like Spatial Reasoning	Oct 12, 2021	Representation LearningSpatial Reasoning	—Unverified
Video Perception Models for 3D Scene Synthesis	Jun 25, 2025	3D ReconstructionImage Generation	—Unverified
VideoSAVi: Self-Aligned Video Language Models without Human Supervision	Dec 1, 2024	EgoSchemaMVBench	—Unverified
VisionArena: 230K Real World User-VLM Conversations with Preference Labels	Dec 11, 2024	ChatbotSpatial Reasoning	—Unverified
Vision-Integrated LLMs for Autonomous Driving Assistance : Human Performance Comparison and Trust Evaluation	Feb 6, 2025	Autonomous DrivingDecision Making	—Unverified
Visual Agentic AI for Spatial Reasoning with a Dynamic API	Feb 10, 2025	Program SynthesisSpatial Reasoning	—Unverified
VisualEchoes: Spatial Image Representation Learning through Echolocation	May 4, 2020	Depth EstimationMonocular Depth Estimation	—Unverified
Visual Embodied Brain: Let Multimodal Large Language Models See, Think, and Control in Spaces	May 30, 2025	Spatial Reasoning	—Unverified
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning	Nov 15, 2024	DescriptiveObject	—Unverified
VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge	Apr 14, 2025	Logical ReasoningMultimodal Reasoning	—Unverified
VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search	Apr 12, 2025	Spatial Reasoning	—Unverified
ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers	May 26, 2025	cross-modal alignmentPosition	—Unverified

Show:10 25 50

← PrevPage 5 of 10Next →

No leaderboard results yet.