SOTAVerified|Agents Browse Leaderboard About

Video-Text Retrieval

Video-Text retrieval requires understanding of both video and language together. Therefore it's different to video retrieval task.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 81–90 of 111 papers

Title	Date	Tasks	Status	Hype	Score
Harvest Video Foundation Models via Efficient Post-Pretraining	Oct 30, 2023	Question AnsweringText Retrieval	—Unverified	0	0
Generalizing Multimodal Pre-training into Multilingual via Language Acquisition	May 29, 2022	Language AcquisitionRetrieval	—Unverified	0	0
Text-Adaptive Multiple Visual Prototype Matching for Video-Text Retrieval	Sep 27, 2022	Cross-Modal RetrievalRetrieval	—Unverified	0	0
CaReBench: A Fine-Grained Benchmark for Video Captioning and Retrieval	Dec 31, 2024	RetrievalText Retrieval	—Unverified	0	0
TokenFlow: Rethinking Fine-grained Cross-modal Alignment in Vision-Language Retrieval	Sep 28, 2022	cross-modal alignmentRetrieval	—Unverified	0	0
Towards Understanding Camera Motions in Any Video	Apr 21, 2025	Question AnsweringText Retrieval	—Unverified	0	0
Uncertainty-Aware Alignment Network for Cross-Domain Video-Text Retrieval	Sep 21, 2023	Domain AdaptationRetrieval	—Unverified	0	0
Uncertainty-Aware Alignment Network for Cross-Domain Video-Text Retrieval	Sep 21, 2023	Domain AdaptationRetrieval	—Unverified	0	0
Uncertainty-aware sign language video retrieval with probability distribution modeling	May 30, 2024	RetrievalSign Language Retrieval	—Unverified	0	0
Exploiting Visual Semantic Reasoning for Video-Text Retrieval	Jun 16, 2020	RetrievalText Retrieval	—Unverified	0	0

Show:10 25 50

← PrevPage 9 of 12Next →

No leaderboard results yet.