Video Recognition

Video Recognition is a process of obtaining, processing, and analysing data that it receives from a visual source, specifically video.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 307 papers

Title	Date	Tasks	Status	Hype
DVFL-Net: A Lightweight Distilled Video Focal Modulation Network for Spatio-Temporal Action Recognition	Jul 16, 2025	BenchmarkingKnowledge Distillation	CodeCode Available	0
VCRBench: Exploring Long-form Causal Reasoning Capabilities of Large Video Language Models	May 13, 2025	FormMultiple-choice	CodeCode Available	0
Gameplay Highlights Generation	May 12, 2025	Event DetectionHighlight Detection	—Unverified	0
Fast Adversarial Training with Weak-to-Strong Spatial-Temporal Consistency in the Frequency Domain on Videos	Apr 21, 2025	Adversarial RobustnessVideo Recognition	—Unverified	0
CA^2ST: Cross-Attention in Audio, Space, and Time for Holistic Video Recognition	Mar 30, 2025	Action ClassificationAction Recognition	—Unverified	0
Leveraging LLMs with Iterative Loop Structure for Enhanced Social Intelligence in Video Question Answering	Mar 27, 2025	Emotion RecognitionQuestion Answering	—Unverified	0
BASKET: A Large-Scale Video Dataset for Fine-Grained Skill Estimation	Mar 26, 2025	Video Recognition	CodeCode Available	1
PAVE: Patching and Adapting Video Large Language Models	Mar 25, 2025	Audio-visual Question AnsweringMulti-Task Learning	CodeCode Available	1
VTD-CLIP: Video-to-Text Discretization via Prompting CLIP	Mar 24, 2025	parameter-efficient fine-tuningVideo Recognition	CodeCode Available	0
Towards Scalable Modeling of Compressed Videos for Efficient Action Recognition	Mar 17, 2025	Action RecognitionVideo Recognition	—Unverified	0
A Simple and Efficient Baseline for Video Action Recognition	Mar 2, 2025	Action RecognitionFine-grained Action Recognition	—Unverified	0
VideoPure: Diffusion-based Adversarial Purification for Video Recognition	Jan 25, 2025	Adversarial DefenseAdversarial Purification	CodeCode Available	0
Action Detail Matters: Refining Video Recognition with Local Action Queries	Jan 1, 2025	Action RecognitionTemporal Action Localization	—Unverified	0
DAVE: Diverse Atomic Visual Elements Dataset with High Representation of Vulnerable Road Users in Complex and Unpredictable Environments	Dec 28, 2024	Action LocalizationAction Recognition	—Unverified	0
Uni-AdaFocus: Spatial-temporal Dynamic Computation for Video Recognition	Dec 15, 2024	Computational EfficiencyVideo Recognition	CodeCode Available	2
Standardization Trends on Safety and Trustworthiness Technology for Advanced AI	Oct 29, 2024	Video Recognition	—Unverified	0
MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer	Oct 14, 2024	Transfer LearningVideo Recognition	CodeCode Available	0
Scaling Up Your Kernels: Large Kernel Design in ConvNets towards Universal Representations	Oct 10, 2024	Time Series ForecastingVideo Recognition	CodeCode Available	5
A Novel Audio-Visual Information Fusion System for Mental Disorders Detection	Sep 3, 2024	EEGVideo Recognition	—Unverified	0
GenRec: Unifying Video Generation and Recognition with Diffusion Models	Aug 27, 2024	Image to Video GenerationVideo Generation	CodeCode Available	0
OmniCLIP: Adapting CLIP for Video Recognition with Spatial-Temporal Omni-Scale Feature Learning	Aug 12, 2024	Video RecognitionZero-Shot Learning	CodeCode Available	1
VideoMamba: Spatio-Temporal Selective State Space Model	Jul 11, 2024	Mambamodel	CodeCode Available	1
Purification Of Contaminated Convolutional Neural Networks Via Robust Recovery: An Approach with Theoretical Guarantee in One-Hidden-Layer Case	Jul 4, 2024	image-classificationImage Classification	—Unverified	0
PosMLP-Video: Spatial and Temporal Relative Position Encoding for Efficient Video Recognition	Jul 3, 2024	PositionVideo Recognition	CodeCode Available	0
MeMSVD: Long-Range Temporal Structure Capturing Using Incremental SVD	Jun 11, 2024	Video RecognitionVideo Understanding	—Unverified	0

Show:10 25 50

← PrevPage 1 of 13Next →

No leaderboard results yet.