Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 453 papers

Title	Date	Tasks	Status
VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models	May 27, 2025	Spatial ReasoningVisual Tracking	—Unverified
VLM-R^3: Region Recognition, Reasoning, and Refinement for Enhanced Multimodal Chain-of-Thought	May 22, 2025	Spatial Reasoning	—Unverified
VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning	Feb 2, 2025	Spatial ReasoningVision-Language Navigation	—Unverified
What is needed for simple spatial language capabilities in VQA?	Aug 17, 2019	DiagnosticQuestion Answering	—Unverified
Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction	Oct 24, 2024	Novel View SynthesisPose Estimation	—Unverified
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities	Jun 20, 2024	Spatial ReasoningVisual Reasoning	—Unverified
WildVision: Evaluating Vision-Language Models in the Wild with Human Preferences	Jun 16, 2024	BenchmarkingSpatial Reasoning	—Unverified
World-aware Planning Narratives Enhance Large Vision-Language Model Planner	Jun 26, 2025	Imitation LearningLanguage Modeling	—Unverified
Perturbed State Space Feature Encoders for Optical Flow with Event Cameras	Apr 14, 2025	Event-based Optical FlowOptical Flow Estimation	—Unverified
REVISION: Rendering Tools Enable Spatial Fidelity in Vision-Language Models	Aug 5, 2024	Question AnsweringSpatial Reasoning	—Unverified
A Light and Smart Wearable Platform with Multimodal Foundation Model for Enhanced Spatial Reasoning in People with Blindness and Low Vision	May 16, 2025	Large Language ModelNavigate	—Unverified
Leveraging LLMs for Mission Planning in Precision Agriculture	Jun 11, 2025	Spatial Reasoning	—Unverified
3D-MoE: A Mixture-of-Experts Multi-modal LLM for 3D Vision and Pose Diffusion via Rectified Flow	Jan 28, 2025	Instruction FollowingMixture-of-Experts	—Unverified
3DSRBench: A Comprehensive 3D Spatial Reasoning Benchmark	Dec 10, 2024	Autonomous NavigationSpatial Reasoning	—Unverified
A Call for New Recipes to Enhance Spatial Reasoning in MLLMs	Apr 21, 2025	Spatial Reasoning	—Unverified
ActionFlow: Equivariant, Accurate, and Efficient Policies with Spatially Symmetric Flow Matching	Sep 6, 2024	Action GenerationSpatial Reasoning	—Unverified
Space-LLaVA: a Vision-Language Model Adapted to Extraterrestrial Applications	Aug 12, 2024	Instruction FollowingLanguage Modeling	—Unverified
A dual contrastive framework	Dec 13, 2024	Contrastive LearningDecoder	—Unverified
Advancing Egocentric Video Question Answering with Multimodal Large Language Models	Apr 6, 2025	Object RecognitionQuestion Answering	—Unverified
AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations	Apr 10, 2025	Spatial ReasoningVisual Grounding	—Unverified
Aerial Vision-and-Language Navigation via Semantic-Topo-Metric Representation Guided LLM Reasoning	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
AeroVerse: UAV-Agent Benchmark Suite for Simulating, Pre-training, Finetuning, and Evaluating Aerospace Embodied World Models	Aug 28, 2024	Spatial ReasoningTask Planning	—Unverified
Aether: Geometric-Aware Unified World Modeling	Mar 24, 2025	Dynamic ReconstructionPrediction	—Unverified
Agentic 3D Scene Generation with Spatially Contextualized VLMs	May 26, 2025	Multimodal ReasoningScene Generation	—Unverified
AI's Spatial Intelligence: Evaluating AI's Understanding of Spatial Transformations in PSVT:R and Augmented Reality	Nov 9, 2024	Spatial Reasoning	—Unverified
A LLM Benchmark based on the Minecraft Builder Dialog Agent Task	Jul 17, 2024	MathMinecraft	—Unverified
AlphaSpace: Enabling Robotic Actions through Semantic Tokenization and Symbolic Reasoning	Mar 24, 2025	Spatial Reasoning	—Unverified
A Multi-Modal Spatial Risk Framework for EV Charging Infrastructure Using Remote Sensing	Jun 10, 2025	Spatial Reasoning	—Unverified
An Empirical Study of Conformal Prediction in LLM with ASP Scaffolds for Robust Reasoning	Mar 7, 2025	Conformal PredictionLanguage Modelling	—Unverified
A Neural Representation Framework with LLM-Driven Spatial Reasoning for Open-Vocabulary 3D Visual Grounding	Jul 9, 2025	3D visual groundingAutonomous Navigation	—Unverified
An Evaluation of ChatGPT-4's Qualitative Spatial Reasoning Capabilities in RCC-8	Sep 27, 2023	Spatial Reasoning	—Unverified
A Pilot Evaluation of ChatGPT and DALL-E 2 on Decision Making and Spatial Reasoning	Feb 15, 2023	Decision MakingSpatial Reasoning	—Unverified
Dspy-based Neural-Symbolic Pipeline to Enhance Spatial Reasoning in LLMs	Nov 27, 2024	Logical ReasoningSemantic Parsing	—Unverified
Architect: Generating Vivid and Interactive 3D Scenes with Hierarchical 2D Inpainting	Nov 14, 2024	Depth EstimationImage Inpainting	—Unverified
Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning?	May 17, 2025	HallucinationObject Counting	—Unverified
A Review of 3D Object Detection with Vision-Language Models	Apr 25, 2025	3D Object DetectionObject	—Unverified
A Schema-Guided Reason-while-Retrieve framework for Reasoning on Scene Graphs with Large-Language-Models (LLMs)	Feb 5, 2025	HallucinationSpatial Reasoning	—Unverified
A Self-Supervised Auxiliary Loss for Deep RL in Partially Observable Settings	Apr 17, 2021	NavigateSpatial Reasoning	—Unverified
A Solver-Aided Hierarchical Language for LLM-Driven CAD Design	Feb 13, 2025	Spatial Reasoning	—Unverified
ASPMT(QS): Non-Monotonic Spatial Reasoning with Answer Set Programming Modulo Theories	Jun 16, 2015	Spatial Reasoning	—Unverified
A Spoken Dialogue System for Spatial Question Answering in a Physical Blocks World	Nov 6, 2019	Natural Language UnderstandingQuestion Answering	—Unverified
A Surprising Failure? Multimodal LLMs and the NLVR Challenge	Feb 26, 2024	SentenceSpatial Reasoning	—Unverified
A Survey for Foundation Models in Autonomous Driving	Feb 2, 2024	3D Object DetectionAutonomous Driving	—Unverified
A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified
A Symbolic Representation of Human Posture for Interpretable Learning and Reasoning	Oct 17, 2022	Activity RecognitionSpatial Reasoning	—Unverified
Atari-GPT: Benchmarking Multimodal Large Language Models as Low-Level Policies in Atari Games	Aug 28, 2024	Atari GamesBenchmarking	—Unverified
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features	Jan 7, 2025	3D Object DetectionComputational Efficiency	—Unverified
A Vision Centric Remote Sensing Benchmark	Mar 20, 2025	Question AnsweringRepresentation Learning	—Unverified
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games	Nov 20, 2024	BenchmarkingNetHack	—Unverified
Beyond Human Vision: The Role of Large Vision Language Models in Microscope Image Analysis	May 1, 2024	Image CaptioningQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 6 of 10Next →

No leaderboard results yet.