Video Recognition

Video Recognition is a process of obtaining, processing, and analysing data that it receives from a visual source, specifically video.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–275 of 307 papers

Title	Date	Tasks	Status
HaltingVT: Adaptive Token Halting Transformer for Efficient Video Recognition	Jan 10, 2024	Action RecognitionAction Recognition In Videos	CodeCode Available
PosMLP-Video: Spatial and Temporal Relative Position Encoding for Efficient Video Recognition	Jul 3, 2024	PositionVideo Recognition	CodeCode Available
Heuristic Black-box Adversarial Attacks on Video Recognition Models	Nov 21, 2019	Adversarial AttackVideo Recognition	CodeCode Available
Hiera: A Hierarchical Vision Transformer without the Bells-and-Whistles	Jun 1, 2023	Action ClassificationAction Recognition	CodeCode Available
ST-ABN: Visual Explanation Taking into Account Spatio-temporal Information for Video Recognition	Oct 29, 2021	Decision MakingVideo Recognition	CodeCode Available
Hierarchical Augmentation and Distillation for Class Incremental Audio-Visual Video Recognition	Jan 11, 2024	Video Recognition	CodeCode Available
VidConv: A modernized 2D ConvNet for Efficient Video Recognition	Jul 8, 2022	Action RecognitionVideo Recognition	CodeCode Available
Collaborative Spatio-temporal Feature Learning for Video Action Recognition	Mar 4, 2019	Action RecognitionAction Recognition In Videos	CodeCode Available
TaCA: Upgrading Your Visual Foundation Model with Task-agnostic Compatible Adapter	Jun 22, 2023	Question AnsweringRetrieval	CodeCode Available
Inter-intra Variant Dual Representations forSelf-supervised Video Recognition	Jul 2, 2021	Contrastive LearningRepresentation Learning	CodeCode Available
Collaborative Spatiotemporal Feature Learning for Video Action Recognition	Jun 1, 2019	Action ClassificationAction Recognition	CodeCode Available
Adaptive occlusion sensitivity analysis for visually explaining video recognition networks	Jul 26, 2022	Decision Makingimage-classification	CodeCode Available
A^2-Nets: Double Attention Networks	Dec 1, 2018	Action ClassificationAction Recognition	CodeCode Available
QTTNet: Quantized Tensor Train Neural Networks for 3D Object and Video Recognition.	Sep 20, 2021	QuantizationVideo Recognition	CodeCode Available
Multi-Modal Multi-Action Video Recognition	Jan 1, 2021	RelationVideo Recognition	CodeCode Available
Don't Judge by the Look: Towards Motion Coherent Video Representation	Mar 14, 2024	Data AugmentationObject Recognition	CodeCode Available
Unleashing the Power of CNN and Transformer for Balanced RGB-Event Video Recognition	Dec 18, 2023	Video Recognition	CodeCode Available
VTD-CLIP: Video-to-Text Discretization via Prompting CLIP	Mar 24, 2025	parameter-efficient fine-tuningVideo Recognition	CodeCode Available
DriftNet: Aggressive Driving Behavior Classification using 3D EfficientNet Architecture	Apr 18, 2020	Anomaly DetectionClassification	CodeCode Available
VideoPure: Diffusion-based Adversarial Purification for Video Recognition	Jan 25, 2025	Adversarial DefenseAdversarial Purification	CodeCode Available
Revisiting 3D ResNets for Video Recognition	Sep 3, 2021	Action ClassificationContrastive Learning	CodeCode Available
Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution	Apr 10, 2019	Action ClassificationImage Classification	CodeCode Available
Video Transformer Network	Feb 1, 2021	Action ClassificationAction Recognition	CodeCode Available
VCRBench: Exploring Long-form Causal Reasoning Capabilities of Large Video Language Models	May 13, 2025	FormMultiple-choice	CodeCode Available
Object-centric Video Representation for Long-term Action Anticipation	Oct 31, 2023	Action AnticipationHuman-Object Interaction Detection	CodeCode Available

Show:10 25 50

← PrevPage 11 of 13Next →

No leaderboard results yet.