SOTAVerified|Agents Browse Leaderboard About

Natural Language Queries

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 81–90 of 337 papers

Title	Date	Tasks	Status	Hype
A Modular Multitask Reasoning Framework Integrating Spatio-temporal Models and LLMs	Jun 25, 2025	In-Context LearningNatural Language Queries	—Unverified	0
Invocable APIs derived from NL2SQL datasets for LLM Tool-Calling Evaluation	Jun 12, 2025	Intent DetectionNatural Language Queries	—Unverified	0
Improving Personalized Search with Regularized Low-Rank Parameter Updates	Jun 11, 2025	General KnowledgeImage Retrieval	CodeCode Available	0
MLVTG: Mamba-Based Feature Alignment and LLM-Driven Purification for Multi-Modal Video Temporal Grounding	Jun 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
Technical Report for Argoverse2 Scenario Mining Challenges on Iterative Error Correction and Spatially-Aware Prompting	Jun 10, 2025	Autonomous DrivingCode Generation	—Unverified	0
DGMO: Training-Free Audio Source Separation through Diffusion-Guided Mask Optimization	Jun 3, 2025	Audio GenerationAudio Source Separation	—Unverified	0
ACCESS DENIED INC: The First Benchmark Environment for Sensitivity Awareness	Jun 1, 2025	BenchmarkingManagement	CodeCode Available	0
A Graph-Retrieval-Augmented Generation Framework Enhances Decision-Making in the Circular Economy	Jun 1, 2025	Decision MakingMulti-hop Question Answering	—Unverified	0
MGS3: A Multi-Granularity Self-Supervised Code Search Framework	May 30, 2025	Code SearchContrastive Learning	—Unverified	0
CoRet: Improved Retriever for Code Editing	May 30, 2025	Natural Language QueriesRetrieval	—Unverified	0

Show:10 25 50

← PrevPage 9 of 34Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	EgoVideo	R@1 Mean(0.3 and 0.5)	23.68	—	Unverified
2	DeCafNet-100%	R@1 Mean(0.3 and 0.5)	18.86	—	Unverified
3	DeCafNet-50%	R@1 Mean(0.3 and 0.5)	17.93	—	Unverified
4	RGNet	R@1 Mean(0.3 and 0.5)	16.55	—	Unverified
5	DeCafNet-50% (no NaQ)	R@1 Mean(0.3 and 0.5)	15.32	—	Unverified
6	InternVideo	R@1 Mean(0.3 and 0.5)	13.26	—	Unverified
7	EgoVLPv2	R@1 IoU=0.3	12.95	—	Unverified
8	UniMD+Sync.	R@1 Mean(0.3 and 0.5)	12.11	—	Unverified
9	ReLER@ZJU-Alibaba	R@1 Mean(0.3 and 0.5)	10.52	—	Unverified
10	EgoVLP	R@1 Mean(0.3 and 0.5)	8.35	—	Unverified