Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 453 papers

Title	Date	Tasks	Status
Advancing Egocentric Video Question Answering with Multimodal Large Language Models	Apr 6, 2025	Object RecognitionQuestion Answering	—Unverified
AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations	Apr 10, 2025	Spatial ReasoningVisual Grounding	—Unverified
Aerial Vision-and-Language Navigation via Semantic-Topo-Metric Representation Guided LLM Reasoning	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
AeroVerse: UAV-Agent Benchmark Suite for Simulating, Pre-training, Finetuning, and Evaluating Aerospace Embodied World Models	Aug 28, 2024	Spatial ReasoningTask Planning	—Unverified
Aether: Geometric-Aware Unified World Modeling	Mar 24, 2025	Dynamic ReconstructionPrediction	—Unverified
Agentic 3D Scene Generation with Spatially Contextualized VLMs	May 26, 2025	Multimodal ReasoningScene Generation	—Unverified
AI's Spatial Intelligence: Evaluating AI's Understanding of Spatial Transformations in PSVT:R and Augmented Reality	Nov 9, 2024	Spatial Reasoning	—Unverified
A LLM Benchmark based on the Minecraft Builder Dialog Agent Task	Jul 17, 2024	MathMinecraft	—Unverified
AlphaSpace: Enabling Robotic Actions through Semantic Tokenization and Symbolic Reasoning	Mar 24, 2025	Spatial Reasoning	—Unverified
A Multi-Modal Spatial Risk Framework for EV Charging Infrastructure Using Remote Sensing	Jun 10, 2025	Spatial Reasoning	—Unverified
An Empirical Study of Conformal Prediction in LLM with ASP Scaffolds for Robust Reasoning	Mar 7, 2025	Conformal PredictionLanguage Modelling	—Unverified
A Neural Representation Framework with LLM-Driven Spatial Reasoning for Open-Vocabulary 3D Visual Grounding	Jul 9, 2025	3D visual groundingAutonomous Navigation	—Unverified
An Evaluation of ChatGPT-4's Qualitative Spatial Reasoning Capabilities in RCC-8	Sep 27, 2023	Spatial Reasoning	—Unverified
A Pilot Evaluation of ChatGPT and DALL-E 2 on Decision Making and Spatial Reasoning	Feb 15, 2023	Decision MakingSpatial Reasoning	—Unverified
Dspy-based Neural-Symbolic Pipeline to Enhance Spatial Reasoning in LLMs	Nov 27, 2024	Logical ReasoningSemantic Parsing	—Unverified
Architect: Generating Vivid and Interactive 3D Scenes with Hierarchical 2D Inpainting	Nov 14, 2024	Depth EstimationImage Inpainting	—Unverified
Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning?	May 17, 2025	HallucinationObject Counting	—Unverified
A Review of 3D Object Detection with Vision-Language Models	Apr 25, 2025	3D Object DetectionObject	—Unverified
A Schema-Guided Reason-while-Retrieve framework for Reasoning on Scene Graphs with Large-Language-Models (LLMs)	Feb 5, 2025	HallucinationSpatial Reasoning	—Unverified
A Self-Supervised Auxiliary Loss for Deep RL in Partially Observable Settings	Apr 17, 2021	NavigateSpatial Reasoning	—Unverified
A Solver-Aided Hierarchical Language for LLM-Driven CAD Design	Feb 13, 2025	Spatial Reasoning	—Unverified
ASPMT(QS): Non-Monotonic Spatial Reasoning with Answer Set Programming Modulo Theories	Jun 16, 2015	Spatial Reasoning	—Unverified
A Spoken Dialogue System for Spatial Question Answering in a Physical Blocks World	Nov 6, 2019	Natural Language UnderstandingQuestion Answering	—Unverified
A Surprising Failure? Multimodal LLMs and the NLVR Challenge	Feb 26, 2024	SentenceSpatial Reasoning	—Unverified
A Survey for Foundation Models in Autonomous Driving	Feb 2, 2024	3D Object DetectionAutonomous Driving	—Unverified
A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified
A Symbolic Representation of Human Posture for Interpretable Learning and Reasoning	Oct 17, 2022	Activity RecognitionSpatial Reasoning	—Unverified
Atari-GPT: Benchmarking Multimodal Large Language Models as Low-Level Policies in Atari Games	Aug 28, 2024	Atari GamesBenchmarking	—Unverified
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features	Jan 7, 2025	3D Object DetectionComputational Efficiency	—Unverified
A Vision Centric Remote Sensing Benchmark	Mar 20, 2025	Question AnsweringRepresentation Learning	—Unverified
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games	Nov 20, 2024	BenchmarkingNetHack	—Unverified
Beyond Human Vision: The Role of Large Vision Language Models in Microscope Image Analysis	May 1, 2024	Image CaptioningQuestion Answering	—Unverified
Beyond Recognition: Evaluating Visual Perspective Taking in Vision Language Models	May 3, 2025	DiagnosticObject Recognition	—Unverified
Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models	Mar 21, 2025	DiagnosticObject Recognition	—Unverified
Beyond the Hype: A dispassionate look at vision-language models in medical scenario	Aug 16, 2024	Question AnsweringSpatial Reasoning	—Unverified
Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios	Mar 10, 2025	Image RestorationImage Super-Resolution	—Unverified
Bridging Visualization and Optimization: Multimodal Large Language Models on Graph-Structured Combinatorial Optimization	Jan 21, 2025	Combinatorial OptimizationSequential Decision Making	—Unverified
ByDeWay: Boost Your multimodal LLM with DEpth prompting in a Training-Free Way	Jul 11, 2025	Depth EstimationHallucination	—Unverified
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs	Dec 27, 2024	Spatial Reasoning	—Unverified
Can Large Language Models Create New Knowledge for Spatial Reasoning Tasks?	May 23, 2024	Spatial Reasoning	—Unverified
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind	May 18, 2025	BenchmarkingScene Understanding	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps	May 24, 2025	Scene UnderstandingSpatial Reasoning	—Unverified
CASPER: Cognitive Architecture for Social Perception and Engagement in Robots	Sep 1, 2022	Action RecognitionNavigate	—Unverified
Chain of Semantics Programming in 3D Gaussian Splatting Representation for 3D Vision Grounding	Jan 1, 2025	3DGSLarge Language Model	—Unverified
Challenge of Spatial Cognition for Deep Learning	Jul 30, 2019	Deep LearningSpatial Reasoning	—Unverified
Challenges Faced by Large Language Models in Solving Multi-Agent Flocking	Apr 6, 2024	Decision MakingSpatial Reasoning	—Unverified
CleverDistiller: Simple and Spatially Consistent Cross-modal Distillation	Mar 12, 2025	3D Object DetectionAutonomous Driving	—Unverified
Cog-GA: A Large Language Models-based Generative Agent for Vision-Language Navigation in Continuous Environments	Sep 4, 2024	Continual LearningNavigate	—Unverified
Combining Deep Learning and Qualitative Spatial Reasoning to Learn Complex Structures from Sparse Examples with Noise	Nov 27, 2018	AI AgentHeuristic Search	—Unverified

Show:10 25 50

← PrevPage 5 of 10Next →

No leaderboard results yet.