Video Recognition

Video Recognition is a process of obtaining, processing, and analysing data that it receives from a visual source, specifically video.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 307 papers

Title	Date	Tasks	Status	Hype
ZeroI2V: Zero-Cost Adaptation of Pre-trained Transformers from Image to Video	Oct 2, 2023	Action ClassificationAction Recognition	CodeCode Available	1
Disentangling Spatial and Temporal Learning for Efficient Image-to-Video Transfer Learning	Sep 14, 2023	Transfer LearningVideo Recognition	CodeCode Available	1
Phase-Specific Augmented Reality Guidance for Microscopic Cataract Surgery Using Long-Short Spatiotemporal Aggregation Transformer	Sep 11, 2023	Multi-Task LearningVideo Recognition	—Unverified	0
Video Task Decathlon: Unifying Image and Video Tasks in Autonomous Driving	Sep 8, 2023	AllAutonomous Driving	—Unverified	0
Eventful Transformers: Leveraging Temporal Redundancy in Vision Transformers	Aug 25, 2023	Action RecognitionObject Detection	CodeCode Available	1
Learning from Semantic Alignment between Unpaired Multiviews for Egocentric Video Recognition	Aug 22, 2023	Multiview LearningVideo Recognition	CodeCode Available	0
Audio-Visual Class-Incremental Learning	Aug 21, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1
Temporal-Distributed Backdoor Attack Against Video Based Action Recognition	Aug 21, 2023	Action RecognitionBackdoor Attack	—Unverified	0
Audio-Visual Glance Network for Efficient Video Recognition	Aug 18, 2023	Video RecognitionVideo Understanding	—Unverified	0
Helping Hands: An Object-Aware Ego-Centric Video Recognition Model	Aug 15, 2023	DecoderObject	CodeCode Available	1
On the Importance of Spatial Relations for Few-shot Action Recognition	Aug 14, 2023	Action RecognitionFew-Shot action recognition	—Unverified	0
Orthogonal Temporal Interpolation for Zero-Shot Video Recognition	Aug 14, 2023	Video RecognitionZero-Shot Action Recognition	CodeCode Available	0
View while Moving: Efficient Video Recognition in Long-untrimmed Videos	Aug 9, 2023	Video Recognition	—Unverified	0
Prune Spatio-temporal Tokens by Semantic-aware Temporal Accumulation	Aug 8, 2023	Video Recognition	CodeCode Available	1
What Can Simple Arithmetic Operations Do for Temporal Modeling?	Jul 18, 2023	Action ClassificationAction Recognition	CodeCode Available	1
Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action Recognition	Jul 13, 2023	Action RecognitionTemporal Action Localization	CodeCode Available	1
TaCA: Upgrading Your Visual Foundation Model with Task-agnostic Compatible Adapter	Jun 22, 2023	Question AnsweringRetrieval	CodeCode Available	0
Enhanced Multimodal Representation Learning with Cross-modal KD	Jun 13, 2023	Contrastive LearningEmotion Classification	—Unverified	0
A two-way translation system of Chinese sign language based on computer vision	Jun 3, 2023	SentenceSign Language Recognition	—Unverified	0
Hiera: A Hierarchical Vision Transformer without the Bells-and-Whistles	Jun 1, 2023	Action ClassificationAction Recognition	CodeCode Available	0
Spatiotemporal Attention-based Semantic Compression for Real-time Video Recognition	May 22, 2023	Action RecognitionDecoder	—Unverified	0
Inter-frame Accelerate Attack against Video Interpolation Models	May 11, 2023	Adversarial RobustnessVideo Frame Interpolation	—Unverified	0
Multi-object Video Generation from Single Frame Layouts	May 6, 2023	Image GenerationObject	—Unverified	0
Implicit Temporal Modeling with Learnable Alignment for Video Recognition	Apr 20, 2023	Action ClassificationAction Recognition	CodeCode Available	1
Use Your Head: Improving Long-Tail Video Recognition	Apr 3, 2023	Video Recognition	CodeCode Available	0

Show:10 25 50

← PrevPage 3 of 13Next →

No leaderboard results yet.