Video Recognition

Video Recognition is a process of obtaining, processing, and analysing data that it receives from a visual source, specifically video.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 307 papers

Title	Date	Tasks	Status	Hype	Score
InternVideo2: Scaling Foundation Models for Multimodal Video Understanding	Mar 22, 2024	Action ClassificationAction Recognition	CodeCode Available	7	5
Scaling Up Your Kernels: Large Kernel Design in ConvNets towards Universal Representations	Oct 10, 2024	Time Series ForecastingVideo Recognition	CodeCode Available	5	5
Expanding Language-Image Pretrained Models for General Video Recognition	Aug 4, 2022	Action ClassificationAction Recognition	CodeCode Available	3	5
Bidirectional Cross-Modal Knowledge Exploration for Video Recognition with Pre-trained Vision-Language Models	Dec 31, 2022	Action ClassificationAction Recognition	CodeCode Available	2	5
Video Swin Transformer	Jun 24, 2021	Action ClassificationAction Recognition	CodeCode Available	2	5
Dynamic Tuning Towards Parameter and Inference Efficiency for ViT Adaptation	Mar 18, 2024	Mixture-of-Expertsparameter-efficient fine-tuning	CodeCode Available	2	5
AdaptFormer: Adapting Vision Transformers for Scalable Visual Recognition	May 26, 2022	Action RecognitionVideo Recognition	CodeCode Available	2	5
Omni-sourced Webly-supervised Learning for Video Recognition	Mar 29, 2020	Action ClassificationAction Recognition	CodeCode Available	2	5
Uni-AdaFocus: Spatial-temporal Dynamic Computation for Video Recognition	Dec 15, 2024	Computational EfficiencyVideo Recognition	CodeCode Available	2	5
X3D: Expanding Architectures for Efficient Video Recognition	Apr 9, 2020	Action Classificationfeature selection	CodeCode Available	2	5
DeMamba: AI-Generated Video Detection on Million-Scale GenVideo Benchmark	May 30, 2024	DeepFake DetectionMamba	CodeCode Available	2	5
TSM: Temporal Shift Module for Efficient and Scalable Video Understanding on Edge Device	Sep 27, 2021	Video RecognitionVideo Understanding	CodeCode Available	2	5
Revisiting Classifier: Transferring Vision-Language Models for Video Recognition	Jul 4, 2022	Action ClassificationAction Recognition	CodeCode Available	2	5
Would Mega-scale Datasets Further Enhance Spatiotemporal 3D CNNs?	Apr 10, 2020	General ClassificationOpen-Ended Question Answering	CodeCode Available	2	5
Adaptive Focus for Efficient Video Recognition	May 7, 2021	Computational EfficiencyGPU	CodeCode Available	1	5
Cluster and Aggregate: Face Recognition with Large Probe Set	Oct 19, 2022	Face RecognitionFace Verification	CodeCode Available	1	5
Depth Guided Adaptive Meta-Fusion Network for Few-shot Video Recognition	Oct 20, 2020	Action RecognitionFew Shot Action Recognition	CodeCode Available	1	5
Adapting Short-Term Transformers for Action Detection in Untrimmed Videos	Dec 4, 2023	Action DetectionVideo Recognition	CodeCode Available	1	5
Clean-Label Backdoor Attacks on Video Recognition Models	Mar 6, 2020	Backdoor Attackbackdoor defense	CodeCode Available	1	5
Clockwork Convnets for Video Semantic Segmentation	Aug 11, 2016	Image SegmentationScheduling	CodeCode Available	1	5
DEVIAS: Learning Disentangled Video Representations of Action and Scene	Nov 30, 2023	Action RecognitionDecoder	CodeCode Available	1	5
Boosting the Transferability of Video Adversarial Examples via Temporal Translation	Oct 18, 2021	Adversarial AttackTranslation	CodeCode Available	1	5
AdaMML: Adaptive Multi-Modal Learning for Efficient Video Recognition	May 11, 2021	Video Recognition	CodeCode Available	1	5
Attacking Video Recognition Models with Bullet-Screen Comments	Oct 29, 2021	Adversarial AttackAdversarial Attack on Video Classification	CodeCode Available	1	5
Building an Open-Vocabulary Video CLIP Model with Better Architectures, Optimization and Data	Oct 8, 2023	Action RecognitionContinual Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 1 of 13Next →

No leaderboard results yet.