Visual Tracking

Visual Tracking is an essential and actively researched problem in the field of computer vision with various real-world applications such as robotic services, smart surveillance systems, autonomous driving, and human-computer interaction. It refers to the automatic estimation of the trajectory of an arbitrary target object, usually specified by a bounding box in the first frame, as it moves around in subsequent video frames.

Source: Learning Reinforced Attentional Representation for End-to-End Visual Tracking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 525 papers

Title	Date	Tasks	Status	Hype
What You Have is What You Track: Adaptive and Robust Multimodal Tracking	Jul 8, 2025	Mixture-of-ExpertsVisual Tracking	CodeCode Available	0
R1-Track: Direct Application of MLLMs to Visual Object Tracking via Reinforcement Learning	Jun 27, 2025	Object TrackingTemplate Matching	CodeCode Available	2
Exploiting Lightweight Hierarchical ViT and Dynamic Framework for Efficient Visual Tracking	Jun 25, 2025	GPUVisual Tracking	CodeCode Available	1
Comparison of Two Methods for Stationary Incident Detection Based on Background Image	Jun 17, 2025	object-detectionObject Detection	—Unverified	0
Towards Effective and Efficient Adversarial Defense with Diffusion Models for Robust Visual Tracking	May 31, 2025	Adversarial DefenseDenoising	CodeCode Available	0
CLDTracker: A Comprehensive Language Description for Visual Tracking	May 29, 2025	Image CaptioningVisual Tracking	CodeCode Available	0
TrackVLA: Embodied Visual Tracking in the Wild	May 29, 2025	Language ModelingLanguage Modelling	—Unverified	0
VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models	May 27, 2025	Spatial ReasoningVisual Tracking	—Unverified	0
Hierarchical Instruction-aware Embodied Visual Tracking	May 27, 2025	Action GenerationPosition	—Unverified	0
Efficient Motion Prompt Learning for Robust Visual Tracking	May 22, 2025	DecoderPrompt Learning	CodeCode Available	1
Towards Adaptive Meta-Gradient Adversarial Examples for Visual Tracking	May 13, 2025	Adversarial AttackAutonomous Driving	CodeCode Available	0
DeepSORT-Driven Visual Tracking Approach for Gesture Recognition in Interactive Systems	May 11, 2025	Gesture Recognitionmultimodal interaction	—Unverified	0
Predicting Road Surface Anomalies by Visual Tracking of a Preceding Vehicle	May 7, 2025	Autonomous DrivingVisual Tracking	—Unverified	0
Adversarial Attack for RGB-Event based Visual Object Tracking	Apr 19, 2025	Adversarial AttackObject Tracking	CodeCode Available	0
SPMTrack: Spatio-Temporal Parameter-Efficient Fine-Tuning with Mixture of Experts for Scalable Visual Tracking	Mar 24, 2025	Mixture-of-Expertsparameter-efficient fine-tuning	CodeCode Available	1
Towards General Multimodal Visual Tracking	Mar 14, 2025	MambaVisual Tracking	—Unverified	0
Similarity-Guided Layer-Adaptive Vision Transformer for UAV Tracking	Mar 9, 2025	Visual Tracking	CodeCode Available	2
Two-stream Beats One-stream: Asymmetric Siamese Network for Efficient Visual Tracking	Mar 1, 2025	CPUGPU	CodeCode Available	1
Technical Report for ReID-SAM on SkiTB Visual Tracking Challenge 2025	Feb 28, 2025	object-detectionObject Detection	—Unverified	0
CFTrack: Enhancing Lightweight Visual Tracking through Contrastive Learning and Feature Matching	Feb 27, 2025	Contrastive LearningVisual Tracking	—Unverified	0
Enhanced Transformer-Based Tracking for Skiing Events: Overcoming Multi-Camera Challenges, Scale Variations and Rapid Motion -- SkiTB Visual Tracking Challenge 2025	Feb 26, 2025	Visual Tracking	—Unverified	0
DreamTrack: Dreaming the Future for Multimodal Visual Object Tracking	Jan 1, 2025	Object TrackingTemplate Matching	—Unverified	0
Autoregressive Sequential Pretraining for Visual Tracking	Jan 1, 2025	ObjectObject Tracking	—Unverified	0
Exploring Historical Information for RGBE Visual Tracking with Mamba	Jan 1, 2025	DecoderLong-range modeling	—Unverified	0
Less is More: Token Context-aware Learning for Object Tracking	Jan 1, 2025	Object TrackingVisual Tracking	CodeCode Available	1
FusionSORT: Fusion Methods for Online Multi-object Visual Tracking	Jan 1, 2025	ObjectVisual Tracking	CodeCode Available	0
Learning an Adaptive and View-Invariant Vision Transformer for Real-Time UAV Tracking	Dec 28, 2024	Knowledge DistillationVisual Tracking	CodeCode Available	2
Exploring Enhanced Contextual Information for Video-Level Object Tracking	Dec 15, 2024	ObjectObject Tracking	CodeCode Available	2
Improving Accuracy and Generalization for Efficient Visual Tracking	Nov 28, 2024	CPUTest-time Adaptation	—Unverified	0
A Distractor-Aware Memory for Visual Object Tracking with SAM2	Nov 26, 2024	Object TrackingSemi-Supervised Video Object Segmentation	CodeCode Available	3
SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory	Nov 18, 2024	Object TrackingVisual Object Tracking	CodeCode Available	9
Vision Eagle Attention: a new lens for advancing image classification	Nov 15, 2024	image-classificationImage Classification	CodeCode Available	1
MFTIQ: Multi-Flow Tracker with Independent Matching Quality Estimation	Nov 14, 2024	Optical Flow EstimationVisual Tracking	CodeCode Available	1
ChatTracker: Enhancing Visual Tracking Performance via Chatting with Multimodal Large Language Model	Nov 4, 2024	Language ModelingLanguage Modelling	—Unverified	0
IP-MOT: Instance Prompt Learning for Cross-Domain Multi-Object Tracking	Oct 30, 2024	Knowledge DistillationLanguage Modelling	—Unverified	0
The Solution for Single Object Tracking Task of Perception Test Challenge 2024	Oct 19, 2024	Object TrackingVisual Tracking	—Unverified	0
Improving Visual Object Tracking through Visual Prompting	Sep 27, 2024	Object	CodeCode Available	1
Distilling Channels for Efficient Deep Tracking	Sep 18, 2024	Feature CompressionVisual Tracking	—Unverified	0
Camouflaged Object Tracking: A Benchmark	Aug 25, 2024	ObjectObject Tracking	CodeCode Available	0
Low-Light Object Tracking: A Benchmark	Aug 21, 2024	ObjectObject Tracking	CodeCode Available	1
MambaEVT: Event Stream based Visual Object Tracking using State Space Model	Aug 20, 2024	MambaObject Localization	CodeCode Available	1
Visible-Thermal Multiple Object Tracking: Large-scale Video Dataset and Progressive Fusion Approach	Aug 2, 2024	cross-modal alignmentMultiple Object Tracking	CodeCode Available	2
Local All-Pair Correspondence for Point Tracking	Jul 22, 2024	AllPoint Tracking	CodeCode Available	3
Diff-Tracker: Text-to-Image Diffusion Models are Unsupervised Trackers	Jul 11, 2024	Visual Tracking	—Unverified	0
Tracking Reflected Objects: A Benchmark	Jul 7, 2024	Autonomous DrivingVisual Tracking	CodeCode Available	0
Learning Motion Blur Robust Vision Transformers with Dynamic Early Exit for Real-Time UAV Tracking	Jul 7, 2024	Visual Tracking	CodeCode Available	0
Adaptively Bypassing Vision Transformer Blocks for Efficient Visual Tracking	Jun 12, 2024	Visual Tracking	CodeCode Available	0
Multi-Granularity Language-Guided Multi-Object Tracking	Jun 7, 2024	Multi-Object TrackingObject	CodeCode Available	1
Robust Visual Tracking via Iterative Gradient Descent and Threshold Selection	Jun 2, 2024	regressionVisual Tracking	—Unverified	0
XTrack: Multimodal Training Boosts RGB-X Video Object Trackers	May 28, 2024	Inductive BiasMixture-of-Experts	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 11Next →

All datasets TNL2K DAVIS Kinetics Kubric RGB-Stacking LaSOT OTB-100 OTB-2013 Second dialogue state tracking challenge TrackingNet

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ARTrack-L	AUC	60.3	—	Unverified
2	UNINEXT-H	AUC	59.3	—	Unverified
3	JointNLT	AUC	56.9	—	Unverified
4	OSTrack	AUC	55.9	—	Unverified
5	TransT	AUC	50.7	—	Unverified
6	AdaSwitcher	AUC	42	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAPIR (Panning MOVi-E)	Average Jaccard	61.3	—	Unverified
2	TAPIR (MOVi-E)	Average Jaccard	59.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAPIR (Panning MOVi-E)	Average Jaccard	57.2	—	Unverified
2	TAPIR (MOVi-E)	Average Jaccard	57.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAPIR (Panning MOVi-E)	Average Jaccard	84.7	—	Unverified
2	TAPIR (MOVi-E)	Average Jaccard	84.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAPIR (MOVi-E)	Average Jaccard	66.2	—	Unverified
2	TAPIR (Panning MOVi-E)	Average Jaccard	62.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TATrack-L	AUC	71.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SiamFC-lu (Ours)	AUC	0.32	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SiamFC-lu (Ours)	AUC	0.66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MDNet	Score	0.64	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TATrack-L	ACCURACY	0.85	—	Unverified