Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 453 papers

Title	Date	Tasks	Status
Beyond Recognition: Evaluating Visual Perspective Taking in Vision Language Models	May 3, 2025	DiagnosticObject Recognition	—Unverified
Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models	Mar 21, 2025	DiagnosticObject Recognition	—Unverified
Beyond the Hype: A dispassionate look at vision-language models in medical scenario	Aug 16, 2024	Question AnsweringSpatial Reasoning	—Unverified
Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios	Mar 10, 2025	Image RestorationImage Super-Resolution	—Unverified
Bridging Visualization and Optimization: Multimodal Large Language Models on Graph-Structured Combinatorial Optimization	Jan 21, 2025	Combinatorial OptimizationSequential Decision Making	—Unverified
ByDeWay: Boost Your multimodal LLM with DEpth prompting in a Training-Free Way	Jul 11, 2025	Depth EstimationHallucination	—Unverified
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs	Dec 27, 2024	Spatial Reasoning	—Unverified
Can Large Language Models Create New Knowledge for Spatial Reasoning Tasks?	May 23, 2024	Spatial Reasoning	—Unverified
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind	May 18, 2025	BenchmarkingScene Understanding	—Unverified
Can LLM be a Good Path Planner based on Prompt Engineering? Mitigating the Hallucination for Path Planning	Aug 23, 2024	HallucinationPrompt Engineering	—Unverified
Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps	May 24, 2025	Scene UnderstandingSpatial Reasoning	—Unverified
CASPER: Cognitive Architecture for Social Perception and Engagement in Robots	Sep 1, 2022	Action RecognitionNavigate	—Unverified
Chain of Semantics Programming in 3D Gaussian Splatting Representation for 3D Vision Grounding	Jan 1, 2025	3DGSLarge Language Model	—Unverified
Challenge of Spatial Cognition for Deep Learning	Jul 30, 2019	Deep LearningSpatial Reasoning	—Unverified
Challenges Faced by Large Language Models in Solving Multi-Agent Flocking	Apr 6, 2024	Decision MakingSpatial Reasoning	—Unverified
CleverDistiller: Simple and Spatially Consistent Cross-modal Distillation	Mar 12, 2025	3D Object DetectionAutonomous Driving	—Unverified
Cog-GA: A Large Language Models-based Generative Agent for Vision-Language Navigation in Continuous Environments	Sep 4, 2024	Continual LearningNavigate	—Unverified
Combining Deep Learning and Qualitative Spatial Reasoning to Learn Complex Structures from Sparse Examples with Noise	Nov 27, 2018	AI AgentHeuristic Search	—Unverified
Commonsense Spatial Reasoning for Visually Intelligent Agents	Apr 1, 2021	Spatial Reasoning	—Unverified
Commonsense Visual Sensemaking for Autonomous Driving: On Generalised Neurosymbolic Online Abduction Integrating Vision and Semantics	Dec 28, 2020	Autonomous DrivingQuestion Answering	—Unverified
Complexity Classification in Infinite-Domain Constraint Satisfaction	Jan 4, 2012	ClassificationGeneral Classification	—Unverified
Contextual Reasoning for Scene Generation (Technical Report)	May 3, 2023	Scene GenerationSpatial Reasoning	—Unverified
Contrastive Region Guidance: Improving Grounding in Vision-Language Models without Training	Mar 4, 2024	MathPhrase Grounding	—Unverified
Controllable Text-to-Image Generation with GPT-4	May 29, 2023	Image GenerationInstruction Following	—Unverified
DARE: Diverse Visual Question Answering with Robustness Evaluation	Sep 26, 2024	image-classificationImage Classification	—Unverified
DataPlatter: Boosting Robotic Manipulation Generalization with Minimal Costly Data	Mar 25, 2025	Robot ManipulationSpatial Reasoning	—Unverified
DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?	May 22, 2025	AttributeSpatial Reasoning	—Unverified
Dialectical language model evaluation: An initial appraisal of the commonsense spatial reasoning abilities of LLMs	Apr 22, 2023	Language Model EvaluationLanguage Modeling	—Unverified
Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning	Jun 5, 2025	In-Context LearningIndoor Scene Synthesis	—Unverified
Distortions in Judged Spatial Relations in Large Language Models	Jan 8, 2024	MisconceptionsSpatial Reasoning	—Unverified
DivCon: Divide and Conquer for Progressive Text-to-Image Generation	Mar 11, 2024	Image GenerationLayout-to-Image Generation	—Unverified
Do Multimodal Language Models Really Understand Direction? A Benchmark for Compass Direction Reasoning	Dec 21, 2024	Spatial Reasoning	—Unverified
DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models	Feb 19, 2024	Autonomous DrivingScene Understanding	—Unverified
Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning	Mar 10, 2025	Autonomous NavigationMotion Generation	—Unverified
EarthGPT-X: Enabling MLLMs to Flexibly and Comprehensively Understand Multi-Source Remote Sensing Imagery	Apr 17, 2025	Large Language ModelMulti-Task Learning	—Unverified
Ego-Centric Spatial Memory Networks	Jan 1, 2021	CPUGPU	—Unverified
Ego-Humans: An Ego-Centric 3D Multi-Human Benchmark	Jan 1, 2023	3D Pose EstimationHuman Detection	—Unverified
Embodied Chain of Action Reasoning with Multi-Modal Foundation Model for Humanoid Loco-manipulation	Apr 13, 2025	NavigateObject Rearrangement	—Unverified
Embodied Scene Understanding for Vision Language Models via MetaVQA	Jan 15, 2025	Decision MakingQuestion Answering	—Unverified
EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks	Mar 14, 2025	Spatial Reasoning	—Unverified
Embodied World Models Emerge from Navigational Task in Open-Ended Environments	Apr 15, 2025	Meta Reinforcement LearningSpatial Reasoning	—Unverified
EmbRACE-3K: Embodied Reasoning and Action in Complex Environments	Jul 14, 2025	Scene UnderstandingSpatial Reasoning	—Unverified
Endowing Embodied Agents with Spatial Reasoning Capabilities for Vision-and-Language Navigation	Apr 9, 2025	HallucinationSpatial Reasoning	—Unverified
Evaluating Robustness of Visual Representations for Object Assembly Task Requiring Spatio-Geometrical Reasoning	Oct 15, 2023	BenchmarkingSpatial Reasoning	—Unverified
Explicit Object Relation Alignment for Vision and Language Navigation	Nov 16, 2021	Instruction FollowingRelation	—Unverified
Exploring and Improving the Spatial Reasoning Abilities of Large Language Models	Dec 2, 2023	Spatial Reasoning	—Unverified
Exploring Spatial Language Grounding Through Referring Expressions	Feb 4, 2025	Image CaptioningNegation	—Unverified
Exploring The Spatial Reasoning Ability of Neural Models in Human IQ Tests	Apr 11, 2020	Question AnsweringSpatial Reasoning	—Unverified
Fine-grained Qualitative Spatial Reasoning about Point Positions	Nov 15, 2019	Spatial Reasoning	—Unverified
First Order Logic with Fuzzy Semantics for Describing and Recognizing Nerves in Medical Images	Apr 30, 2025	Spatial Reasoning	—Unverified

Show:10 25 50

← PrevPage 7 of 10Next →

No leaderboard results yet.