Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 453 papers

Title	Date	Tasks	Status	Hype
ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment	Mar 4, 2025	MinecraftSpatial Reasoning	—Unverified	0
Why Is Spatial Reasoning Hard for VLMs? An Attention Mechanism Perspective on Focus Areas	Mar 3, 2025	Spatial Reasoning	CodeCode Available	2
FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks	Feb 25, 2025	Image GenerationLayout Generation	CodeCode Available	0
Introducing Visual Perception Token into Multimodal Large Language Model	Feb 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
VisFactor: Benchmarking Fundamental Visual Cognition in Multimodal Large Language Models	Feb 23, 2025	BenchmarkingSpatial Reasoning	CodeCode Available	0
From Text to Space: Mapping Abstract Spatial Models in LLMs during a Grid-World Navigation Task	Feb 23, 2025	Decision MakingNavigate	CodeCode Available	0
AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO	Feb 20, 2025	Autonomous NavigationNavigate	CodeCode Available	2
Mem2Ego: Empowering Vision-Language Models with Global-to-Ego Memory for Long-Horizon Embodied Navigation	Feb 20, 2025	Decision MakingEfficient Exploration	—Unverified	0
CityEQA: A Hierarchical LLM Agent on Embodied Question Answering Benchmark in City Space	Feb 18, 2025	Embodied Question AnsweringQuestion Answering	CodeCode Available	1
SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation	Feb 18, 2025	Object RearrangementRobot Manipulation	CodeCode Available	3
Large Language Models and Mathematical Reasoning Failures	Feb 17, 2025	Mathematical ReasoningPhysical Intuition	—Unverified	0
Large Language-Geometry Model: When LLM meets Equivariance	Feb 16, 2025	modelSpatial Reasoning	—Unverified	0
STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning	Feb 14, 2025	Decision MakingSpatial Reasoning	—Unverified	0
A Solver-Aided Hierarchical Language for LLM-Driven CAD Design	Feb 13, 2025	Spatial Reasoning	—Unverified	0
Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Multimodal Models	Feb 12, 2025	AttributeDiagnostic	CodeCode Available	1
Visual Agentic AI for Spatial Reasoning with a Dynamic API	Feb 10, 2025	Program SynthesisSpatial Reasoning	—Unverified	0
Vision-Integrated LLMs for Autonomous Driving Assistance : Human Performance Comparison and Trust Evaluation	Feb 6, 2025	Autonomous DrivingDecision Making	—Unverified	0
iVISPAR -- An Interactive Visual-Spatial Reasoning Benchmark for VLMs	Feb 5, 2025	Spatial Reasoning	CodeCode Available	1
A Schema-Guided Reason-while-Retrieve framework for Reasoning on Scene Graphs with Large-Language-Models (LLMs)	Feb 5, 2025	HallucinationSpatial Reasoning	—Unverified	0
Enhancing Reasoning to Adapt Large Language Models for Domain-Specific Applications	Feb 5, 2025	In-Context LearningLanguage Modeling	CodeCode Available	1
Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Geospatial Reasoning Questions	Feb 4, 2025	Question AnsweringRAG	—Unverified	0
Exploring Spatial Language Grounding Through Referring Expressions	Feb 4, 2025	Image CaptioningNegation	—Unverified	0
VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning	Feb 2, 2025	Spatial ReasoningVision-Language Navigation	—Unverified	0
RLS3: RL-Based Synthetic Sample Selection to Enhance Spatial Reasoning in Vision-Language Models for Indoor Autonomous Perception	Jan 31, 2025	Reinforcement Learning (RL)Spatial Reasoning	—Unverified	0
3D-MoE: A Mixture-of-Experts Multi-modal LLM for 3D Vision and Pose Diffusion via Rectified Flow	Jan 28, 2025	Instruction FollowingMixture-of-Experts	—Unverified	0
Bridging Visualization and Optimization: Multimodal Large Language Models on Graph-Structured Combinatorial Optimization	Jan 21, 2025	Combinatorial OptimizationSequential Decision Making	—Unverified	0
SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning	Jan 17, 2025	Spatial ReasoningTask Planning	—Unverified	0
HSPFormer: Hierarchical Spatial Perception Transformer for Semantic Segmentation	Jan 16, 2025	Depth EstimationMonocular Depth Estimation	CodeCode Available	1
Embodied Scene Understanding for Vision Language Models via MetaVQA	Jan 15, 2025	Decision MakingQuestion Answering	—Unverified	0
Imagine while Reasoning in Space: Multimodal Visualization-of-Thought	Jan 13, 2025	Spatial Reasoning	CodeCode Available	2
MM-GEN: Enhancing Task Performance Through Targeted Multimodal Data Curation	Jan 7, 2025	Spatial Reasoning	CodeCode Available	0
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features	Jan 7, 2025	3D Object DetectionComputational Efficiency	—Unverified	0
R2C: Mapping Room to Chessboard to Unlock LLM As Low-Level Action Planner	Jan 1, 2025	Action GenerationGame of Chess	—Unverified	0
Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Mutimodal Models	Jan 1, 2025	AttributeDiagnostic	—Unverified	0
Chain of Semantics Programming in 3D Gaussian Splatting Representation for 3D Vision Grounding	Jan 1, 2025	3DGSLarge Language Model	—Unverified	0
SKE-Layout: Spatial Knowledge Enhanced Layout Generation with LLMs	Jan 1, 2025	Contrastive LearningImage Generation	—Unverified	0
SpatialCLIP: Learning 3D-aware Image Representations from Spatially Discriminative Language	Jan 1, 2025	Spatial Reasoning	—Unverified	0
MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models	Dec 31, 2024	Multiple-choiceQuestion Answering	CodeCode Available	0
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs	Dec 27, 2024	Spatial Reasoning	—Unverified	0
Expand VSR Benchmark for VLLM to Expertize in Spatial Rules	Dec 24, 2024	MMESensitivity	CodeCode Available	0
Path-of-Thoughts: Extracting and Following Paths for Robust Relational Reasoning with Large Language Models	Dec 23, 2024	Relational ReasoningSpatial Reasoning	—Unverified	0
Do Multimodal Language Models Really Understand Direction? A Benchmark for Compass Direction Reasoning	Dec 21, 2024	Spatial Reasoning	—Unverified	0
Investigating Relational State Abstraction in Collaborative MARL	Dec 19, 2024	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	0
Mathematical Definition and Systematization of Puzzle Rules	Dec 18, 2024	Game DesignSpatial Reasoning	—Unverified	0
Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces	Dec 18, 2024	Question AnsweringSpatial Reasoning	CodeCode Available	4
SPHERE: A Hierarchical Evaluation on Spatial Perception and Reasoning for Vision-Language Models	Dec 17, 2024	Logical ReasoningSpatial Reasoning	CodeCode Available	0
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning	Dec 16, 2024	HallucinationRobot Manipulation	CodeCode Available	2
A dual contrastive framework	Dec 13, 2024	Contrastive LearningDecoder	—Unverified	0
Geo-LLaVA: A Large Multi-Modal Model for Solving Geometry Math Problems with Meta In-Context Learning	Dec 12, 2024	Geometry Problem SolvingIn-Context Learning	—Unverified	0
VisionArena: 230K Real World User-VLM Conversations with Preference Labels	Dec 11, 2024	ChatbotSpatial Reasoning	—Unverified	0

Show:10 25 50

← PrevPage 4 of 10Next →

No leaderboard results yet.