Action Anticipation

Next action anticipation is defined as observing 1, ... , T frames and predicting the action that happens after a gap of T_a seconds. It is important to note that a new action starts after T_a seconds that is not seen in the observed frames. Here T_a=1 second.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 110 papers

Title	Date	Tasks	Status	Hype
V-JEPA 2: Self-Supervised Video Models Enable Understanding, Prediction and Planning	Jun 11, 2025	Action AnticipationLarge Language Model	CodeCode Available	7
EgoExoLearn: A Dataset for Bridging Asynchronous Ego- and Exo-centric View of Procedural Activities in Real World	Mar 24, 2024	Action AnticipationAction Quality Assessment	CodeCode Available	2
EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation	Jun 26, 2024	Action AnticipationAction Recognition	CodeCode Available	2
MeMViT: Memory-Augmented Multiscale Vision Transformer for Efficient Long-Term Video Recognition	Jan 20, 2022	Action AnticipationAction Classification	CodeCode Available	1
Gated Temporal Diffusion for Stochastic Long-Term Dense Anticipation	Jul 16, 2024	Action AnticipationAutonomous Driving	CodeCode Available	1
Multimodal Large Models Are Effective Action Anticipators	Jan 1, 2025	Action AnticipationLong Term Action Anticipation	CodeCode Available	1
Action Scene Graphs for Long-Form Understanding of Egocentric Videos	Dec 6, 2023	Action AnticipationForm	CodeCode Available	1
Rethinking Learning Approaches for Long-Term Action Anticipation	Oct 20, 2022	Action AnticipationFuture prediction	CodeCode Available	1
Technical Report: Temporal Aggregate Representations	Jun 6, 2021	Action AnticipationAction Recognition	CodeCode Available	1
What Would You Expect? Anticipating Egocentric Actions with Rolling-Unrolling LSTMs and Modality Attention	May 22, 2019	Action AnticipationAction Recognition	CodeCode Available	1
Temporal Aggregate Representations for Long-Range Video Understanding	Jun 1, 2020	Action AnticipationAction Recognition	CodeCode Available	1
Anticipative Video Transformer	Jun 3, 2021	Action Anticipation	CodeCode Available	1
AntGPT: Can Large Language Models Help Long-term Action Anticipation from Videos?	Jul 31, 2023	Action Anticipationcounterfactual	CodeCode Available	1
Anticipative Feature Fusion Transformer for Multi-Modal Action Anticipation	Oct 23, 2022	Action Anticipation	CodeCode Available	1
Pedestrian 3D Bounding Box Prediction	Jun 28, 2022	Action AnticipationAutonomous Driving	CodeCode Available	1
Palm: Predicting Actions through Language Models @ Ego4D Long-Term Action Anticipation Challenge 2023	Jun 28, 2023	Action AnticipationImage Captioning	CodeCode Available	1
Real-time Online Video Detection with Temporal Smoothing Transformers	Sep 19, 2022	Action AnticipationAction Detection	CodeCode Available	1
Rescaling Egocentric Vision	Jun 23, 2020	Action AnticipationAction Detection	CodeCode Available	1
Higher Order Recurrent Space-Time Transformer for Video Action Prediction	Apr 17, 2021	Action AnticipationAction Recognition	CodeCode Available	1
Video Representation Learning with Visual Tempo Consistency	Jun 28, 2020	Action AnticipationAction Detection	CodeCode Available	1
A Dynamic Spatial-temporal Attention Network for Early Anticipation of Traffic Accidents	Jun 18, 2021	Accident AnticipationAction Anticipation	CodeCode Available	1
Intention-Conditioned Long-Term Human Egocentric Action Forecasting	Jul 25, 2022	Action AnticipationLong Term Action Anticipation	CodeCode Available	1
Pedestrian Action Anticipation using Contextual Feature Fusion in Stacked RNNs	May 13, 2020	Action AnticipationAutonomous Vehicles	CodeCode Available	1
Semantically Guided Representation Learning For Action Anticipation	Jul 2, 2024	Action AnticipationRepresentation Learning	CodeCode Available	1
Learning State-Aware Visual Representations from Audible Interactions	Sep 27, 2022	Action AnticipationAction Recognition	CodeCode Available	1
Action Anticipation with Goal Consistency	Jun 26, 2023	Action Anticipation	CodeCode Available	1
Rolling-Unrolling LSTMs for Action Anticipation from First-Person Video	May 4, 2020	Action AnticipationAction Recognition	CodeCode Available	1
Video + CLIP Baseline for Ego4D Long-term Action Anticipation	Jul 1, 2022	Action AnticipationLong Term Action Anticipation	CodeCode Available	1
MANTA: Diffusion Mamba for Efficient and Effective Stochastic Long-Term Dense Action Anticipation	Jan 1, 2025	Action AnticipationMamba	CodeCode Available	1
Future Transformer for Long-term Action Anticipation	May 27, 2022	Action AnticipationLong Term Action Anticipation	CodeCode Available	1
Action Anticipation for Collaborative Environments: The Impact of Contextual Information and Uncertainty-Based Prediction	Oct 1, 2019	Action AnticipationDecision Making	—Unverified	0
Anticipating human actions by correlating past with the future with Jaccard similarity measures	May 26, 2021	Action AnticipationAction Recognition	—Unverified	0
Leveraging Temporal Context in Low Representational Power Regimes	Jan 1, 2023	Action AnticipationAction Recognition	—Unverified	0
Egocentric Object Manipulation Graphs	Jun 5, 2020	Action AnticipationAttribute	—Unverified	0
Analysis over vision-based models for pedestrian action anticipation	May 27, 2023	Action AnticipationAutonomous Vehicles	—Unverified	0
Action Anticipation By Predicting Future Dynamic Images	Aug 1, 2018	Action AnticipationAutonomous Driving	—Unverified	0
DiffAnt: Diffusion Models for Action Anticipation	Nov 27, 2023	Action Anticipation	—Unverified	0
Delving into 3D Action Anticipation from Streaming Videos	Jun 15, 2019	Action AnticipationAction Classification	—Unverified	0
User-in-the-loop Evaluation of Multimodal LLMs for Activity Assistance	Aug 4, 2024	Action AnticipationBenchmarking	—Unverified	0
Leveraging Next-Active Objects for Context-Aware Anticipation in Egocentric Videos	Aug 16, 2023	Action AnticipationActive Object Localization	—Unverified	0
MECCANO: A Multimodal Egocentric Dataset for Humans Behavior Understanding in the Industrial-like Domain	Sep 19, 2022	Action AnticipationAction Recognition	—Unverified	0
Intention Action Anticipation Model with Guide-Feedback Loop Mechanism	Mar 19, 2024	Action AnticipationRelation	—Unverified	0
Deep Sequence Learning for Video Anticipation: From Discrete and Deterministic to Continuous and Stochastic	Oct 9, 2020	Action Anticipation	—Unverified	0
Inductive Attention for Video Action Anticipation	Dec 17, 2022	Action AnticipationAction Recognition	—Unverified	0
ICPR 2024 Competition on Rider Intention Prediction	Mar 11, 2025	Action AnticipationPrediction	—Unverified	0
Can't make an Omelette without Breaking some Eggs: Plausible Action Anticipation using Large Video-Language Models	May 30, 2024	Action Anticipationcounterfactual	—Unverified	0
VLM Agents Generate Their Own Memories: Distilling Experience into Embodied Programs of Thought	Jun 20, 2024	Action AnticipationContinual Learning	—Unverified	0
JOADAA: joint online action detection and action anticipation	Sep 12, 2023	Action AnticipationAction Detection	—Unverified	0
Knowledge Distillation for Action Anticipation via Label Smoothing	Apr 16, 2020	Action AnticipationAutonomous Driving	—Unverified	0
Human Action Anticipation: A Survey	Oct 17, 2024	Action AnticipationAutonomous Vehicles	—Unverified	0

Show:10 25 50

← PrevPage 1 of 3Next →

All datasets EPIC-KITCHENS-100 EPIC-KITCHENS-100 (test)EPIC-KITCHENS-55 (Seen test set (S1))EPIC-KITCHENS-55 (Unseen test set (S2)EGTEA Assembly101 EgoExoLearn 50 Salads

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PlausiVL	Recall@5	27.6	—	Unverified
2	InAViT	Recall@5	25.89	—	Unverified
3	UADT	Recall@5	23	—	Unverified
4	S-GEAR	Recall@5	19.9	—	Unverified
5	AFFT	Recall@5	18.5	—	Unverified
6	MeMViT-24	Recall@5	17.7	—	Unverified
7	AVT+	Recall@5	15.9	—	Unverified
8	TempAgg	Recall@5	14.73	—	Unverified
9	RU-LSTM	Recall@5	13.94	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	InAViT	recall@5	23.75	—	Unverified
2	AVT++	recall@5	16.7	—	Unverified
3	AFFT	recall@5	14.9	—	Unverified
4	Abstract Goal	recall@5	14.29	—	Unverified
5	AVT+	recall@5	12.6	—	Unverified
6	TempAgg	recall@5	12.6	—	Unverified
7	RULSTM	recall@5	11.2	—	Unverified
8	TBN	recall@5	11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Abstract Goal	Top 1 Accuracy - Act.	22.03	—	Unverified
2	AVT+	Top 1 Accuracy - Act.	16.84	—	Unverified
3	ImagineRNN	Top 1 Accuracy - Act.	14.66	—	Unverified
4	RULSTM [24, 23]	Top 1 Accuracy - Act.	14.39	—	Unverified
5	ED	Top 1 Accuracy - Act.	8.08	—	Unverified
6	ATSN	Top 1 Accuracy - Act.	6	—	Unverified
7	2SCNN	Top 1 Accuracy - Act.	4.32	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Abstract Goal	Top 1 Accuracy - Act.	13.28	—	Unverified
2	AVT+	Top 1 Accuracy - Act.	10.41	—	Unverified
3	ImagineRNN	Top 1 Accuracy - Act.	9.25	—	Unverified
4	RULSTM [24, 23]	Top 1 Accuracy - Act.	8.16	—	Unverified
5	ED	Top 1 Accuracy - Act.	2.65	—	Unverified
6	ATSN	Top 1 Accuracy - Act.	2.39	—	Unverified
7	2SCNN	Top 1 Accuracy - Act.	2.29	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UADT	Top-1 Accuracy	68.4	—	Unverified
2	InAViT	Top-1 Accuracy	67.8	—	Unverified
3	Abstract Goal	Top-1 Accuracy	49.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Goal Consistency	Verbs Recall@5	60.04	—	Unverified
2	TempAgg	Verbs Recall@5	59.11	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Action anticipation baseline (co-training, with gaze)	Accuracy	45.45	—	Unverified
2	Action anticipation baseline (co-training, no gaze)	Accuracy	38.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UADT	Top-1 Accuracy	62.7	—	Unverified