SOTAVerified|Agents Browse Leaderboard About

Video-Text Retrieval

Video-Text retrieval requires understanding of both video and language together. Therefore it's different to video retrieval task.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–111 of 111 papers

Title	Date	Tasks	Status	Hype
HiT: Hierarchical Transformer with Momentum Contrast for Video-Text Retrieval	Mar 28, 2021	RetrievalText Retrieval	—Unverified	0
Rudder: A Cross Lingual Video and Text Retrieval Dataset	Mar 9, 2021	Natural Language QueriesRetrieval	CodeCode Available	0
Learning the Best Pooling Strategy for Visual Semantic Embedding	Nov 9, 2020	Cross-Modal Information RetrievalImage-text Retrieval	CodeCode Available	1
COOT: Cooperative Hierarchical Transformer for Video-Text Representation Learning	Nov 1, 2020	Cross-Modal RetrievalRepresentation Learning	CodeCode Available	1
Exploiting Visual Semantic Reasoning for Video-Text Retrieval	Jun 16, 2020	RetrievalText Retrieval	—Unverified	0
Retrieving and Highlighting Action with Spatiotemporal Reference	May 19, 2020	Action RecognitionCross-Modal Retrieval	—Unverified	0
Stacked Convolutional Deep Encoding Network for Video-Text Retrieval	Apr 10, 2020	Language ModelingLanguage Modelling	—Unverified	0
Fine-grained Video-Text Retrieval with Hierarchical Graph Reasoning	Mar 1, 2020	Cross-Modal RetrievalRetrieval	CodeCode Available	1
Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval	Jun 11, 2019	Cross-Modal RetrievalMultiple Instance Learning	CodeCode Available	1
Deep Semantic Multimodal Hashing Network for Scalable Image-Text and Video-Text Retrievals	Jan 9, 2019	Cross-Modal RetrievalDeep Hashing	—Unverified	0
Learning Joint Embedding with Multimodal Cues for Cross-Modal Video-Text Retrieval	Jun 11, 2018	Image-text RetrievalRetrieval	CodeCode Available	0

Show:10 25 50

← PrevPage 3 of 3Next →

No leaderboard results yet.