Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 226–250 of 453 papers

Title	Date	Tasks	Status
A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified
A Symbolic Representation of Human Posture for Interpretable Learning and Reasoning	Oct 17, 2022	Activity RecognitionSpatial Reasoning	—Unverified
Atari-GPT: Benchmarking Multimodal Large Language Models as Low-Level Policies in Atari Games	Aug 28, 2024	Atari GamesBenchmarking	—Unverified
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features	Jan 7, 2025	3D Object DetectionComputational Efficiency	—Unverified
A Vision Centric Remote Sensing Benchmark	Mar 20, 2025	Question AnsweringRepresentation Learning	—Unverified
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games	Nov 20, 2024	BenchmarkingNetHack	—Unverified
Beyond Human Vision: The Role of Large Vision Language Models in Microscope Image Analysis	May 1, 2024	Image CaptioningQuestion Answering	—Unverified
Beyond Recognition: Evaluating Visual Perspective Taking in Vision Language Models	May 3, 2025	DiagnosticObject Recognition	—Unverified
Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models	Mar 21, 2025	DiagnosticObject Recognition	—Unverified
Beyond the Hype: A dispassionate look at vision-language models in medical scenario	Aug 16, 2024	Question AnsweringSpatial Reasoning	—Unverified
Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios	Mar 10, 2025	Image RestorationImage Super-Resolution	—Unverified
Bridging Visualization and Optimization: Multimodal Large Language Models on Graph-Structured Combinatorial Optimization	Jan 21, 2025	Combinatorial OptimizationSequential Decision Making	—Unverified
ByDeWay: Boost Your multimodal LLM with DEpth prompting in a Training-Free Way	Jul 11, 2025	Depth EstimationHallucination	—Unverified
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs	Dec 27, 2024	Spatial Reasoning	—Unverified
Can Large Language Models Create New Knowledge for Spatial Reasoning Tasks?	May 23, 2024	Spatial Reasoning	—Unverified
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind	May 18, 2025	BenchmarkingScene Understanding	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps	May 24, 2025	Scene UnderstandingSpatial Reasoning	—Unverified
CASPER: Cognitive Architecture for Social Perception and Engagement in Robots	Sep 1, 2022	Action RecognitionNavigate	—Unverified
Chain of Semantics Programming in 3D Gaussian Splatting Representation for 3D Vision Grounding	Jan 1, 2025	3DGSLarge Language Model	—Unverified
Challenge of Spatial Cognition for Deep Learning	Jul 30, 2019	Deep LearningSpatial Reasoning	—Unverified
Challenges Faced by Large Language Models in Solving Multi-Agent Flocking	Apr 6, 2024	Decision MakingSpatial Reasoning	—Unverified
CleverDistiller: Simple and Spatially Consistent Cross-modal Distillation	Mar 12, 2025	3D Object DetectionAutonomous Driving	—Unverified
Cog-GA: A Large Language Models-based Generative Agent for Vision-Language Navigation in Continuous Environments	Sep 4, 2024	Continual LearningNavigate	—Unverified
Combining Deep Learning and Qualitative Spatial Reasoning to Learn Complex Structures from Sparse Examples with Noise	Nov 27, 2018	AI AgentHeuristic Search	—Unverified

Show:10 25 50

← PrevPage 10 of 19Next →

No leaderboard results yet.