Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 453 papers

Title	Date	Tasks	Status
Vision-Integrated LLMs for Autonomous Driving Assistance : Human Performance Comparison and Trust Evaluation	Feb 6, 2025	Autonomous DrivingDecision Making	—Unverified
A Schema-Guided Reason-while-Retrieve framework for Reasoning on Scene Graphs with Large-Language-Models (LLMs)	Feb 5, 2025	HallucinationSpatial Reasoning	—Unverified
Exploring Spatial Language Grounding Through Referring Expressions	Feb 4, 2025	Image CaptioningNegation	—Unverified
Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Geospatial Reasoning Questions	Feb 4, 2025	Question AnsweringRAG	—Unverified
VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning	Feb 2, 2025	Spatial ReasoningVision-Language Navigation	—Unverified
RLS3: RL-Based Synthetic Sample Selection to Enhance Spatial Reasoning in Vision-Language Models for Indoor Autonomous Perception	Jan 31, 2025	Reinforcement Learning (RL)Spatial Reasoning	—Unverified
3D-MoE: A Mixture-of-Experts Multi-modal LLM for 3D Vision and Pose Diffusion via Rectified Flow	Jan 28, 2025	Instruction FollowingMixture-of-Experts	—Unverified
Bridging Visualization and Optimization: Multimodal Large Language Models on Graph-Structured Combinatorial Optimization	Jan 21, 2025	Combinatorial OptimizationSequential Decision Making	—Unverified
SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning	Jan 17, 2025	Spatial ReasoningTask Planning	—Unverified
Embodied Scene Understanding for Vision Language Models via MetaVQA	Jan 15, 2025	Decision MakingQuestion Answering	—Unverified
MM-GEN: Enhancing Task Performance Through Targeted Multimodal Data Curation	Jan 7, 2025	Spatial Reasoning	CodeCode Available
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features	Jan 7, 2025	3D Object DetectionComputational Efficiency	—Unverified
SpatialCLIP: Learning 3D-aware Image Representations from Spatially Discriminative Language	Jan 1, 2025	Spatial Reasoning	—Unverified
SKE-Layout: Spatial Knowledge Enhanced Layout Generation with LLMs	Jan 1, 2025	Contrastive LearningImage Generation	—Unverified
Chain of Semantics Programming in 3D Gaussian Splatting Representation for 3D Vision Grounding	Jan 1, 2025	3DGSLarge Language Model	—Unverified
R2C: Mapping Room to Chessboard to Unlock LLM As Low-Level Action Planner	Jan 1, 2025	Action GenerationGame of Chess	—Unverified
Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Mutimodal Models	Jan 1, 2025	AttributeDiagnostic	—Unverified
MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models	Dec 31, 2024	Multiple-choiceQuestion Answering	CodeCode Available
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs	Dec 27, 2024	Spatial Reasoning	—Unverified
Expand VSR Benchmark for VLLM to Expertize in Spatial Rules	Dec 24, 2024	MMESensitivity	CodeCode Available
Path-of-Thoughts: Extracting and Following Paths for Robust Relational Reasoning with Large Language Models	Dec 23, 2024	Relational ReasoningSpatial Reasoning	—Unverified
Do Multimodal Language Models Really Understand Direction? A Benchmark for Compass Direction Reasoning	Dec 21, 2024	Spatial Reasoning	—Unverified
Investigating Relational State Abstraction in Collaborative MARL	Dec 19, 2024	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available
Mathematical Definition and Systematization of Puzzle Rules	Dec 18, 2024	Game DesignSpatial Reasoning	—Unverified
SPHERE: A Hierarchical Evaluation on Spatial Perception and Reasoning for Vision-Language Models	Dec 17, 2024	Logical ReasoningSpatial Reasoning	CodeCode Available
A dual contrastive framework	Dec 13, 2024	Contrastive LearningDecoder	—Unverified
Geo-LLaVA: A Large Multi-Modal Model for Solving Geometry Math Problems with Meta In-Context Learning	Dec 12, 2024	Geometry Problem SolvingIn-Context Learning	—Unverified
VisionArena: 230K Real World User-VLM Conversations with Preference Labels	Dec 11, 2024	ChatbotSpatial Reasoning	—Unverified
3DSRBench: A Comprehensive 3D Spatial Reasoning Benchmark	Dec 10, 2024	Autonomous NavigationSpatial Reasoning	—Unverified
VideoSAVi: Self-Aligned Video Language Models without Human Supervision	Dec 1, 2024	EgoSchemaMVBench	—Unverified
Can Large Language Models Reason about the Region Connection Calculus?	Nov 29, 2024	Spatial Reasoning	CodeCode Available
Grid-augmented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents	Nov 27, 2024	Autonomous NavigationObject Recognition	CodeCode Available
Dspy-based Neural-Symbolic Pipeline to Enhance Spatial Reasoning in LLMs	Nov 27, 2024	Logical ReasoningSemantic Parsing	—Unverified
APT: Architectural Planning and Text-to-Blueprint Construction Using Large Language Models for Open-World Agents	Nov 26, 2024	Few-Shot LearningLarge Language Model	CodeCode Available
RoboSpatial: Teaching Spatial Understanding to 2D and 3D Vision-Language Models for Robotics	Nov 25, 2024	Robot ManipulationScene Understanding	—Unverified
TopV-Nav: Unlocking the Top-View Spatial Reasoning Potential of MLLM for Zero-shot Object Navigation	Nov 25, 2024	Spatial Reasoning	—Unverified
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games	Nov 20, 2024	BenchmarkingNetHack	—Unverified
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning	Nov 15, 2024	DescriptiveObject	—Unverified
Architect: Generating Vivid and Interactive 3D Scenes with Hierarchical 2D Inpainting	Nov 14, 2024	Depth EstimationImage Inpainting	—Unverified
AI's Spatial Intelligence: Evaluating AI's Understanding of Spatial Transformations in PSVT:R and Augmented Reality	Nov 9, 2024	Spatial Reasoning	—Unverified
GPT-4o System Card	Oct 25, 2024	Multiple-choiceSpatial Reasoning	—Unverified
Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction	Oct 24, 2024	Novel View SynthesisPose Estimation	—Unverified
Geometric Feature Enhanced Knowledge Graph Embedding and Spatial Reasoning	Oct 24, 2024	Graph EmbeddingKnowledge Graph Embedding	—Unverified
Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning	Oct 21, 2024	Spatial ReasoningSynthetic Data Generation	—Unverified
Aerial Vision-and-Language Navigation via Semantic-Topo-Metric Representation Guided LLM Reasoning	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
Testing GPT-4-o1-preview on math and science problems: A follow-up study	Oct 11, 2024	MathSpatial Reasoning	—Unverified
Structured Spatial Reasoning with Open Vocabulary Object Detectors	Oct 9, 2024	ObjectObject Rearrangement	—Unverified
Evaluation of Code LLMs on Geospatial Code Generation	Oct 6, 2024	Code GenerationSpatial Reasoning	CodeCode Available
Polymath: A Challenging Multi-modal Mathematical Reasoning Benchmark	Oct 6, 2024	Mathematical ReasoningSpatial Reasoning	CodeCode Available
SPARTUN3D: Situated Spatial Understanding of 3D World in Large Language Models	Oct 4, 2024	Scene UnderstandingSpatial Reasoning	—Unverified

Show:10 25 50

← PrevPage 6 of 10Next →

No leaderboard results yet.