Video Recognition

Video Recognition is a process of obtaining, processing, and analysing data that it receives from a visual source, specifically video.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 307 papers

Title	Date	Tasks	Status
HaltingVT: Adaptive Token Halting Transformer for Efficient Video Recognition	Jan 10, 2024	Action RecognitionAction Recognition In Videos	CodeCode Available
PosMLP-Video: Spatial and Temporal Relative Position Encoding for Efficient Video Recognition	Jul 3, 2024	PositionVideo Recognition	CodeCode Available
Heuristic Black-box Adversarial Attacks on Video Recognition Models	Nov 21, 2019	Adversarial AttackVideo Recognition	CodeCode Available
Hiera: A Hierarchical Vision Transformer without the Bells-and-Whistles	Jun 1, 2023	Action ClassificationAction Recognition	CodeCode Available
ST-ABN: Visual Explanation Taking into Account Spatio-temporal Information for Video Recognition	Oct 29, 2021	Decision MakingVideo Recognition	CodeCode Available
Hierarchical Augmentation and Distillation for Class Incremental Audio-Visual Video Recognition	Jan 11, 2024	Video Recognition	CodeCode Available
VidConv: A modernized 2D ConvNet for Efficient Video Recognition	Jul 8, 2022	Action RecognitionVideo Recognition	CodeCode Available
Collaborative Spatio-temporal Feature Learning for Video Action Recognition	Mar 4, 2019	Action RecognitionAction Recognition In Videos	CodeCode Available
TaCA: Upgrading Your Visual Foundation Model with Task-agnostic Compatible Adapter	Jun 22, 2023	Question AnsweringRetrieval	CodeCode Available
Inter-intra Variant Dual Representations forSelf-supervised Video Recognition	Jul 2, 2021	Contrastive LearningRepresentation Learning	CodeCode Available
Collaborative Spatiotemporal Feature Learning for Video Action Recognition	Jun 1, 2019	Action ClassificationAction Recognition	CodeCode Available
Adaptive occlusion sensitivity analysis for visually explaining video recognition networks	Jul 26, 2022	Decision Makingimage-classification	CodeCode Available
A^2-Nets: Double Attention Networks	Dec 1, 2018	Action ClassificationAction Recognition	CodeCode Available
QTTNet: Quantized Tensor Train Neural Networks for 3D Object and Video Recognition.	Sep 20, 2021	QuantizationVideo Recognition	CodeCode Available
Multi-Modal Multi-Action Video Recognition	Jan 1, 2021	RelationVideo Recognition	CodeCode Available
Don't Judge by the Look: Towards Motion Coherent Video Representation	Mar 14, 2024	Data AugmentationObject Recognition	CodeCode Available
Unleashing the Power of CNN and Transformer for Balanced RGB-Event Video Recognition	Dec 18, 2023	Video Recognition	CodeCode Available
VTD-CLIP: Video-to-Text Discretization via Prompting CLIP	Mar 24, 2025	parameter-efficient fine-tuningVideo Recognition	CodeCode Available
DriftNet: Aggressive Driving Behavior Classification using 3D EfficientNet Architecture	Apr 18, 2020	Anomaly DetectionClassification	CodeCode Available
VideoPure: Diffusion-based Adversarial Purification for Video Recognition	Jan 25, 2025	Adversarial DefenseAdversarial Purification	CodeCode Available
Revisiting 3D ResNets for Video Recognition	Sep 3, 2021	Action ClassificationContrastive Learning	CodeCode Available
Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution	Apr 10, 2019	Action ClassificationImage Classification	CodeCode Available
Video Transformer Network	Feb 1, 2021	Action ClassificationAction Recognition	CodeCode Available
VCRBench: Exploring Long-form Causal Reasoning Capabilities of Large Video Language Models	May 13, 2025	FormMultiple-choice	CodeCode Available
Object-centric Video Representation for Long-term Action Anticipation	Oct 31, 2023	Action AnticipationHuman-Object Interaction Detection	CodeCode Available
Object State Change Classification in Egocentric Videos using the Divided Space-Time Attention Mechanism	Jul 24, 2022	ObjectObject State Change Classification	CodeCode Available
Audiovisual SlowFast Networks for Video Recognition	Jan 23, 2020	Action ClassificationVideo Recognition	CodeCode Available
Automated Sperm Assessment Framework and Neural Network Specialized for Sperm Video Recognition	Nov 10, 2023	Video Recognition	CodeCode Available
DVFL-Net: A Lightweight Distilled Video Focal Modulation Network for Spatio-Temporal Action Recognition	Jul 16, 2025	BenchmarkingKnowledge Distillation	CodeCode Available
Sequence Level Semantics Aggregation for Video Object Detection	Jul 15, 2019	ClusteringObject	CodeCode Available
Learning from Semantic Alignment between Unpaired Multiviews for Egocentric Video Recognition	Aug 22, 2023	Multiview LearningVideo Recognition	CodeCode Available
Learning Spatio-Temporal Representation with Local and Global Diffusion	Jun 13, 2019	Action ClassificationAction Detection	CodeCode Available
Temporal Modeling Approaches for Large-scale Youtube-8M Video Understanding	Jul 14, 2017	Video RecognitionVideo Understanding	CodeCode Available
Learning to Localize Temporal Events in Large-scale Video Data	Oct 25, 2019	Temporal LocalizationVideo Recognition	CodeCode Available
Use Your Head: Improving Long-Tail Video Recognition	Apr 3, 2023	Video Recognition	CodeCode Available
On the Relevance of Temporal Features for Medical Ultrasound Video Recognition	Oct 16, 2023	Video Recognition	CodeCode Available
Excitation Dropout: Encouraging Plasticity in Deep Neural Networks	May 23, 2018	Decision MakingVideo Recognition	CodeCode Available
Open-Ended Multi-Modal Relational Reasoning for Video Question Answering	Dec 1, 2020	Question AnsweringRelational Reasoning	CodeCode Available
LogoStyleFool: Vitiating Video Recognition Systems via Logo Style Transfer	Dec 15, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Optimization Planning for 3D ConvNets	Jan 11, 2022	Video Recognition	CodeCode Available
Long-term Recurrent Convolutional Networks for Visual Recognition and Description	Nov 17, 2014	Image DescriptionRetrieval	CodeCode Available
Orthogonal Temporal Interpolation for Zero-Shot Video Recognition	Aug 14, 2023	Video RecognitionZero-Shot Action Recognition	CodeCode Available
Micro-Batch Training with Batch-Channel Normalization and Weight Standardization	Mar 25, 2019	GPUimage-classification	CodeCode Available
testRNN: Coverage-guided Testing on Recurrent Neural Networks	Jun 20, 2019	Molecular Property PredictionProperty Prediction	CodeCode Available
Overcomplete Representations Against Adversarial Videos	Dec 8, 2020	Adversarial RobustnessDecoder	CodeCode Available
GenRec: Unifying Video Generation and Recognition with Diffusion Models	Aug 27, 2024	Image to Video GenerationVideo Generation	CodeCode Available
Gate-Shift-Fuse for Video Action Recognition	Mar 16, 2022	Action RecognitionTemporal Action Localization	CodeCode Available
Flow-Guided Feature Aggregation for Video Object Detection	Mar 29, 2017	Objectobject-detection	CodeCode Available
FAR: Fourier Aerial Video Recognition	Mar 21, 2022	Action RecognitionActivity Recognition	CodeCode Available
Efficient Robustness Assessment via Adversarial Spatial-Temporal Focus on Videos	Jan 3, 2023	Action RecognitionAdversarial Robustness	CodeCode Available

Show:10 25 50

← PrevPage 6 of 7Next →

No leaderboard results yet.