Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 453 papers

Title	Date	Tasks	Status
Beyond Recognition: Evaluating Visual Perspective Taking in Vision Language Models	May 3, 2025	DiagnosticObject Recognition	—Unverified
Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models	Mar 21, 2025	DiagnosticObject Recognition	—Unverified
Beyond the Hype: A dispassionate look at vision-language models in medical scenario	Aug 16, 2024	Question AnsweringSpatial Reasoning	—Unverified
Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios	Mar 10, 2025	Image RestorationImage Super-Resolution	—Unverified
Bridging Visualization and Optimization: Multimodal Large Language Models on Graph-Structured Combinatorial Optimization	Jan 21, 2025	Combinatorial OptimizationSequential Decision Making	—Unverified
ByDeWay: Boost Your multimodal LLM with DEpth prompting in a Training-Free Way	Jul 11, 2025	Depth EstimationHallucination	—Unverified
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs	Dec 27, 2024	Spatial Reasoning	—Unverified
Can Large Language Models Create New Knowledge for Spatial Reasoning Tasks?	May 23, 2024	Spatial Reasoning	—Unverified
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind	May 18, 2025	BenchmarkingScene Understanding	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps	May 24, 2025	Scene UnderstandingSpatial Reasoning	—Unverified
CASPER: Cognitive Architecture for Social Perception and Engagement in Robots	Sep 1, 2022	Action RecognitionNavigate	—Unverified
Chain of Semantics Programming in 3D Gaussian Splatting Representation for 3D Vision Grounding	Jan 1, 2025	3DGSLarge Language Model	—Unverified
Challenge of Spatial Cognition for Deep Learning	Jul 30, 2019	Deep LearningSpatial Reasoning	—Unverified
Challenges Faced by Large Language Models in Solving Multi-Agent Flocking	Apr 6, 2024	Decision MakingSpatial Reasoning	—Unverified
CleverDistiller: Simple and Spatially Consistent Cross-modal Distillation	Mar 12, 2025	3D Object DetectionAutonomous Driving	—Unverified
Cog-GA: A Large Language Models-based Generative Agent for Vision-Language Navigation in Continuous Environments	Sep 4, 2024	Continual LearningNavigate	—Unverified
Combining Deep Learning and Qualitative Spatial Reasoning to Learn Complex Structures from Sparse Examples with Noise	Nov 27, 2018	AI AgentHeuristic Search	—Unverified
Commonsense Spatial Reasoning for Visually Intelligent Agents	Apr 1, 2021	Spatial Reasoning	—Unverified
Commonsense Visual Sensemaking for Autonomous Driving: On Generalised Neurosymbolic Online Abduction Integrating Vision and Semantics	Dec 28, 2020	Autonomous DrivingQuestion Answering	—Unverified
Complexity Classification in Infinite-Domain Constraint Satisfaction	Jan 4, 2012	ClassificationGeneral Classification	—Unverified
Contextual Reasoning for Scene Generation (Technical Report)	May 3, 2023	Scene GenerationSpatial Reasoning	—Unverified
Contrastive Region Guidance: Improving Grounding in Vision-Language Models without Training	Mar 4, 2024	MathPhrase Grounding	—Unverified
Controllable Text-to-Image Generation with GPT-4	May 29, 2023	Image GenerationInstruction Following	—Unverified
DARE: Diverse Visual Question Answering with Robustness Evaluation	Sep 26, 2024	image-classificationImage Classification	—Unverified

Show:10 25 50

← PrevPage 13 of 19Next →

No leaderboard results yet.