Spatial Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–225 of 453 papers

Title	Date	Tasks	Status
A Review of 3D Object Detection with Vision-Language Models	Apr 25, 2025	3D Object DetectionObject	—Unverified
Spatial Reasoner: A 3D Inference Pipeline for XR Applications	Apr 25, 2025	Spatial Reasoning	—Unverified
A Call for New Recipes to Enhance Spatial Reasoning in MLLMs	Apr 21, 2025	Spatial Reasoning	—Unverified
EarthGPT-X: Enabling MLLMs to Flexibly and Comprehensively Understand Multi-Source Remote Sensing Imagery	Apr 17, 2025	Large Language ModelMulti-Task Learning	—Unverified
Intelligence of Things: A Spatial Context-Aware Control System for Smart Devices	Apr 16, 2025	Spatial Reasoning	—Unverified
Embodied World Models Emerge from Navigational Task in Open-Ended Environments	Apr 15, 2025	Meta Reinforcement LearningSpatial Reasoning	—Unverified
LVLM_CSP: Accelerating Large Vision Language Models via Clustering, Scattering, and Pruning for Reasoning Segmentation	Apr 15, 2025	Image CaptioningQuestion Answering	—Unverified
Perturbed State Space Feature Encoders for Optical Flow with Event Cameras	Apr 14, 2025	Event-based Optical FlowOptical Flow Estimation	—Unverified
A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified
VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge	Apr 14, 2025	Logical ReasoningMultimodal Reasoning	—Unverified
Foundation Models for Remote Sensing: An Analysis of MLLMs for Object Localization	Apr 14, 2025	BenchmarkingEarth Observation	—Unverified
Embodied Chain of Action Reasoning with Multi-Modal Foundation Model for Humanoid Loco-manipulation	Apr 13, 2025	NavigateObject Rearrangement	—Unverified
3D CoCa: Contrastive Learners are 3D Captioners	Apr 13, 2025	3D dense captioningCaption Generation	CodeCode Available
VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search	Apr 12, 2025	Spatial Reasoning	—Unverified
AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations	Apr 10, 2025	Spatial ReasoningVisual Grounding	—Unverified
Endowing Embodied Agents with Spatial Reasoning Capabilities for Vision-and-Language Navigation	Apr 9, 2025	HallucinationSpatial Reasoning	—Unverified
How to Enable LLM with 3D Capacity? A Survey of Spatial Reasoning in LLM	Apr 8, 2025	Autonomous VehiclesSpatial Reasoning	—Unverified
Towards Visual Text Grounding of Multimodal Large Language Model	Apr 7, 2025	BenchmarkingLanguage Modeling	—Unverified
Advancing Egocentric Video Question Answering with Multimodal Large Language Models	Apr 6, 2025	Object RecognitionQuestion Answering	—Unverified
NuScenes-SpatialQA: A Spatial Understanding and Reasoning Benchmark for Vision-Language Models in Autonomous Driving	Apr 4, 2025	3d scene graph generationAutonomous Driving	—Unverified
Enabling Systematic Generalization in Abstract Spatial Reasoning through Meta-Learning for Compositionality	Apr 2, 2025	Meta-LearningSpatial Reasoning	CodeCode Available
RSRWKV: A Linear-Complexity 2D Attention Mechanism for Efficient Remote Sensing Vision Task	Mar 26, 2025	Spatial Reasoning	—Unverified
DataPlatter: Boosting Robotic Manipulation Generalization with Minimal Costly Data	Mar 25, 2025	Robot ManipulationSpatial Reasoning	—Unverified
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?	Mar 25, 2025	Autonomous NavigationQuestion Answering	—Unverified
ST-VLM: Kinematic Instruction Tuning for Spatio-Temporal Reasoning in Vision-Language Models	Mar 25, 2025	4D reconstructionAutonomous Driving	—Unverified

Show:10 25 50

← PrevPage 9 of 19Next →

No leaderboard results yet.