SOTAVerified|Agents Browse Leaderboard About

Audio-visual Question Answering

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–27 of 27 papers

Title	Date	Tasks	Status	Hype	Score
SaSR-Net: Source-Aware Semantic Representation Network for Enhancing Audio-Visual Question Answering	Nov 7, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified	0	0
SHMamba: Structured Hyperbolic State Space Model for Audio-Visual Question Answering	Jun 14, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified	0	0
CLIP-Powered TASS: Target-Aware Single-Stream Network for Audio-Visual Question Answering	May 13, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified	0	0
CAD -- Contextual Multi-modal Alignment for Dynamic AVQA	Oct 25, 2023	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified	0	0
Learning Sparsity for Effective and Efficient Music Performance Question Answering	Jun 2, 2025	Audio-visual Question AnsweringQuestion Answering	—Unverified	0	0
Patch-level Sounding Object Tracking for Audio-Visual Question Answering	Dec 14, 2024	Audio-visual Question AnsweringObject Tracking	—Unverified	0	0
OMCAT: Omni Context Aware Transformer	Oct 15, 2024	Audio-visual Question AnsweringAudio-Visual Question Answering (AVQA)	—Unverified	0	0

Show:10 25 50

← PrevPage 3 of 3Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	VAST	Acc	80.7	—	Unverified
2	CoQo(Internvideo2)	Acc	79.6	—	Unverified
3	VALOR	Acc	78.9	—	Unverified
4	CAD	Acc	78.26	—	Unverified
5	LAVISH	Acc	77.08	—	Unverified
6	ST-AVQA	Acc	71.52	—	Unverified