Action Segmentation

Action Segmentation is a challenging problem in high-level video understanding. In its simplest form, Action Segmentation aims to segment a temporally untrimmed video by time and label each segmented part with one of pre-defined action labels. The results of Action Segmentation can be further used as input to various applications, such as video-to-text and action localization.

Source: TricorNet: A Hybrid Temporal Convolutional and Recurrent Network for Video Action Segmentation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 219 papers

Title	Date	Tasks	Status
Semi-Weakly-Supervised Learning of Complex Actions From Instructional Task Videos	Jan 1, 2022	Action SegmentationWeakly-supervised Learning	CodeCode Available
You Can Wash Hands Better: Accurate Daily Handwashing Assessment with a Smartwatch	Dec 9, 2021	Action SegmentationGesture Recognition	CodeCode Available
Hierarchical Modeling for Task Recognition and Action Segmentation in Weakly-Labeled Instructional Videos	Oct 12, 2021	Action SegmentationSegmentation	CodeCode Available
VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding	Sep 28, 2021	Action LocalizationAction Segmentation	—Unverified
Long Short View Feature Decomposition via Contrastive Video Representation Learning	Sep 23, 2021	Action RecognitionAction Segmentation	—Unverified
TACo: Token-aware Cascade Contrastive Learning for Video-Text Alignment	Aug 23, 2021	Action SegmentationContrastive Learning	—Unverified
Temporal Action Segmentation with High-level Complex Activity Labels	Aug 15, 2021	Action RecognitionAction Segmentation	—Unverified
FIFA: Fast Inference Approximation for Action Segmentation	Aug 9, 2021	Action SegmentationSegmentation	—Unverified
Unsupervised Action Segmentation for Instructional Videos	Jun 7, 2021	Action SegmentationSegmentation	—Unverified
SSCAP: Self-supervised Co-occurrence Action Parsing for Unsupervised Temporal Action Segmentation	May 29, 2021	Action ParsingAction Segmentation	—Unverified
VLM: Task-agnostic Video-Language Model Pre-training for Video Understanding	May 20, 2021	Action SegmentationLanguage Modeling	—Unverified
Unsupervised Discriminative Embedding for Sub-Action Learning in Complex Activities	Apr 30, 2021	Action RecognitionAction Segmentation	—Unverified
Action in Mind: A Neural Network Approach to Action Recognition and Segmentation	Apr 30, 2021	Action RecognitionAction Segmentation	—Unverified
Action Segmentation with Mixed Temporal Domain Adaptation	Apr 15, 2021	Action SegmentationDomain Adaptation	—Unverified
Action Shuffle Alternating Learning for Unsupervised Action Segmentation	Apr 5, 2021	Action SegmentationSegmentation	—Unverified
Anchor-Constrained Viterbi for Set-Supervised Action Segmentation	Apr 5, 2021	Action SegmentationSegmentation	—Unverified
Depthwise Separable Temporal Convolutional Network for Action Segmentation	Jan 19, 2021	Action SegmentationDecoder	—Unverified
Weakly-Supervised Action Segmentation and Alignment via Transcript-Aware Union-of-Subspaces Learning	Jan 1, 2021	Action SegmentationWeakly Supervised Action Segmentation (Transcript)	CodeCode Available
ActBERT: Learning Global-Local Video-Text Representations	Nov 14, 2020	Action SegmentationQuestion Answering	CodeCode Available
Relational Graph Learning on Visual and Kinematics Embeddings for Accurate Gesture Recognition in Robotic Surgery	Nov 3, 2020	Action SegmentationGesture Recognition	—Unverified
Actor and Action Modular Network for Text-based Video Segmentation	Nov 2, 2020	Action SegmentationAction Understanding	—Unverified
Online Spatiotemporal Action Detection and Prediction via Causal Representations	Aug 31, 2020	Action DetectionAction Recognition	CodeCode Available
Improving Action Segmentation via Graph-Based Temporal Reasoning	Jun 1, 2020	Action SegmentationRelation	—Unverified
Motion2Vec: Semi-Supervised Representation Learning from Surgical Videos	May 31, 2020	Action SegmentationMetric Learning	—Unverified
On Evaluating Weakly Supervised Action Segmentation Methods	May 19, 2020	Action SegmentationSegmentation	—Unverified
Hierarchical Attention Network for Action Segmentation	May 7, 2020	Action SegmentationSegmentation	—Unverified
Learning a Weakly-Supervised Video Actor-Action Segmentation Model with a Wise Selection	Mar 29, 2020	Action SegmentationSegmentation	—Unverified
Set-Constrained Viterbi for Set-Supervised Action Segmentation	Feb 27, 2020	Action SegmentationMultiple Instance Learning	—Unverified
Automatic Gesture Recognition in Robot-assisted Surgery with Reinforcement Learning and Tree Search	Feb 20, 2020	Action SegmentationGesture Recognition	—Unverified
Joint Visual-Temporal Embedding for Unsupervised Learning of Actions in Untrimmed Sequences	Jan 29, 2020	Action RecognitionAction Segmentation	—Unverified
Human Action Sequence Classification	Oct 7, 2019	Action ClassificationAction Localization	—Unverified
Weakly Supervised Energy-Based Learning for Action Segmentation	Sep 28, 2019	Action SegmentationSegmentation	CodeCode Available
Fine-grained Action Segmentation using the Semi-Supervised Action GAN	Sep 20, 2019	Action ClassificationAction Segmentation	—Unverified
Coupled Generative Adversarial Network for Continuous Fine-grained Action Segmentation	Sep 20, 2019	Action SegmentationGenerative Adversarial Network	—Unverified
An Efficient 3D CNN for Action/Object Segmentation in Video	Jul 21, 2019	Action SegmentationDecoder	—Unverified
Frontal Low-rank Random Tensors for Fine-grained Action Segmentation	Jun 3, 2019	Action ParsingAction Segmentation	CodeCode Available
A Hybrid RNN-HMM Approach for Weakly Supervised Temporal Action Segmentation	Jun 3, 2019	Action RecognitionAction Segmentation	—Unverified
Representation Learning on Visual-Symbolic Graphs for Video Understanding	May 17, 2019	Action ClassificationAction Detection	—Unverified
Temporal Unet: Sample Level Human Action Recognition using WiFi	Apr 19, 2019	Action LocalizationAction Recognition	CodeCode Available
Unsupervised learning of action classes with continuous temporal embedding	Apr 8, 2019	Action SegmentationUnsupervised Action Segmentation	CodeCode Available
Fast Weakly Supervised Action Segmentation Using Mutual Consistency	Apr 5, 2019	Action SegmentationSegmentation	CodeCode Available
MS-TCN: Multi-Stage Temporal Convolutional Network for Action Segmentation	Mar 5, 2019	Action SegmentationSegmentation	CodeCode Available
Fine-Grained Semantic Segmentation of Motion Capture Data using Dilated Temporal Fully-Convolutional Networks	Mar 2, 2019	Action SegmentationImage Segmentation	—Unverified
Toward Ergonomic Risk Prediction via Segmentation of Indoor Object Manipulation Actions Using Spatiotemporal Convolutional Networks	Feb 14, 2019	Action Segmentation	CodeCode Available
Stacked Spatio-Temporal Graph Convolutional Networks for Action Segmentation	Nov 26, 2018	Action RecognitionAction Segmentation	—Unverified
Actor-Action Semantic Segmentation with Region Masks	Jul 23, 2018	Action SegmentationInstance Segmentation	—Unverified
Dilated Temporal Fully-Convolutional Network for Semantic Segmentation of Motion Capture Data	Jun 24, 2018	Action SegmentationMotion Synthesis	—Unverified
Deep Reinforcement Learning for Surgical Gesture Segmentation and Classification	Jun 21, 2018	Action SegmentationClassification	CodeCode Available
Temporal Deformable Residual Networks for Action Segmentation in Videos	Jun 1, 2018	Action SegmentationSegmentation	—Unverified
VideoCapsuleNet: A Simplified Network for Action Detection	May 21, 2018	Action ClassificationAction Detection	—Unverified

Show:10 25 50

← PrevPage 4 of 5Next →

All datasets Breakfast 50 Salads GTEA COIN Assembly101 JIGSAWS Youtube INRIA Instructional 50Salads MPII Cooking 2 Dataset

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	AdaFocus (newly extracted I3D-features, LT-Context model)	Average F1	76.2	—	Unverified
2	FACT (efficient hybrid of convolution and transformer model)	Average F1	74.7	—	Unverified
3	ASQuery	Average F1	74.6	—	Unverified
4	BIT	Average F1	73.7	—	Unverified
5	DiffAct	Average F1	73.6	—	Unverified
6	BaFormer	Average F1	72.4	—	Unverified
7	CETNet	Average F1	71.8	—	Unverified
8	SF-TMN(ASFormer)	Average F1	71.6	—	Unverified
9	RF++-SSTDA	Acc	70.8	—	Unverified
10	ASPnet	Average F1	70.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Br-Prompt+ASPnet (RGB, flow, accelerometer)	F1@50%	88.5	—	Unverified
2	Semantic2Graph	F1@50%	87.3	—	Unverified
3	BaFormer	F1@50%	83.9	—	Unverified
4	DiffAct	F1@50%	83.7	—	Unverified
5	SF-TMN(ASFormer)	F1@50%	82.9	—	Unverified
6	LTContext	F1@50%	82	—	Unverified
7	UVAST	F1@50%	81.7	—	Unverified
8	Br-Prompt+ASFormer	F1@50%	81.3	—	Unverified
9	EUT	F1@50%	81	—	Unverified
10	CETNet	F1@50%	80.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Semantic2Graph	F1@50%	91.3	—	Unverified
2	FACT	F1@50%	87.5	—	Unverified
3	DiffAct	F1@50%	84.7	—	Unverified
4	BaFormer	F1@50%	83.5	—	Unverified
5	SF-TMN(ASFormer)	F1@50%	83.1	—	Unverified
6	Br-Prompt+ASFormer	F1@50%	83	—	Unverified
7	DPRN	F1@50%	82.9	—	Unverified
8	BIT	F1@50%	82.6	—	Unverified
9	CETNet	F1@50%	81.3	—	Unverified
10	UVAST	F1@50%	81	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnLoc-L	Frame accuracy	72.8	—	Unverified
2	Univl	Frame accuracy	70	—	Unverified
3	Norton	Frame accuracy	69.8	—	Unverified
4	VideoClip	Frame accuracy	68.7	—	Unverified
5	TACo	Frame accuracy	68.4	—	Unverified
6	VLM	Frame accuracy	68.4	—	Unverified
7	MIL-NCE	Frame accuracy	61	—	Unverified
8	ActBERT	Frame accuracy	57	—	Unverified
9	CBT	Frame accuracy	53.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ASQuery	F1@10%	37.8	—	Unverified
2	LTContext	F1@10%	33.9	—	Unverified
3	ASFormer	F1@10%	33.4	—	Unverified
4	C2F-TCN	F1@10%	33.3	—	Unverified
5	UVAST	F1@10%	32.1	—	Unverified
6	MS-TCN++	F1@10%	31.6	—	Unverified
7	ProTAS(Offline)	F1@10%	28.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RL+Tree	Edit Distance	88.53	—	Unverified
2	RL (full)	Edit Distance	87.96	—	Unverified
3	TricorNet	Edit Distance	86.8	—	Unverified
4	SDL+SC-CRF	Edit Distance	86.21	—	Unverified
5	TCN	Edit Distance	83.1	—	Unverified
6	ST-CNN+Seg	Edit Distance	66.56	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TSA (FINCH)	Acc	62.4	—	Unverified
2	TSA (Kmeans)	Acc	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EUT	Acc	87.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Unsup. TW-FINCH (K=avg/activity)	Accuracy	42	—	Unverified