Semantic Parsing

Semantic Parsing is the task of transducing natural language utterances into formal meaning representations. The target meaning representations can be defined according to a wide variety of formalisms. This include linguistically-motivated semantic representations that are designed to capture the meaning of any sentence such as λ-calculus or the abstract meaning representations. Alternatively, for more task-driven approaches to Semantic Parsing, it is common for meaning representations to represent executable programs such as SQL queries, robotic commands, smart phone instructions, and even general-purpose programming languages like Python and Java.

Source: Tranx: A Transition-based Neural Abstract Syntax Parser for Semantic Parsing and Code Generation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 1202 papers

Title	Date	Tasks	Status	Hype
Where, What, Why: Towards Explainable Driver Attention Prediction	Jun 29, 2025	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Beyond Chains: Bridging Large Language Models and Knowledge Bases in Complex Question Answering	May 20, 2025	Knowledge Base Question AnsweringQuestion Answering	—Unverified	0
Creativity or Brute Force? Using Brainteasers as a Window into the Problem-Solving Abilities of Large Language Models	May 16, 2025	Semantic Parsing	—Unverified	0
Sigma: A dataset for text-to-code semantic parsing with statistical analysis	Apr 5, 2025	Question AnsweringSemantic Parsing	CodeCode Available	0
Diverse In-Context Example Selection After Decomposing Programs and Aligned Utterances Improves Semantic Parsing	Apr 4, 2025	Semantic Parsing	CodeCode Available	0
ZOGRASCOPE: A New Benchmark for Property Graphs	Mar 7, 2025	Knowledge GraphsSemantic Parsing	—Unverified	0
Geo-Semantic-Parsing: AI-powered geoparsing by traversing semantic knowledge graphs	Mar 3, 2025	Knowledge GraphsSemantic Parsing	—Unverified	0
Disambiguate First Parse Later: Generating Interpretations for Ambiguity Resolution in Semantic Parsing	Feb 25, 2025	Semantic ParsingText to SQL	CodeCode Available	0
ReVision: A Dataset and Baseline VLM for Privacy-Preserving Task-Oriented Visual Instruction Rewriting	Feb 20, 2025	Image Captioningmultimodal interaction	—Unverified	0
MCTS-KBQA: Monte Carlo Tree Search for Knowledge Base Question Answering	Feb 19, 2025	Decision MakingKnowledge Base Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 1 of 121Next →

All datasets WikiTableQuestions spider CFQ WebQuestionsSP WikiSQL ATIS Geo PTG (czech, MRP 2020)AMR (chinese, MRP 2020)AMR (english, MRP 2020)DRG (english, MRP 2020)DRG (german, MRP 2020)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ARTEMIS-DA	Accuracy (Test)	80.8	—	Unverified
2	SynTQA (Oracle)	Test Accuracy	77.5	—	Unverified
3	TabLaP	Accuracy (Test)	76.6	—	Unverified
4	SynTQA (GPT)	Accuracy (Test)	74.4	—	Unverified
5	Mix SC	Accuracy (Test)	73.6	—	Unverified
6	SynTQA (RF)	Accuracy (Test)	71.6	—	Unverified
7	CABINET	Accuracy (Test)	69.1	—	Unverified
8	NormTab+TabSQLify	Accuracy (Test)	68.63	—	Unverified
9	Chain-of-Table	Accuracy (Test)	67.31	—	Unverified
10	Tab-PoT	Accuracy (Test)	66.78	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	RESDSQL-3B + NatSQL	Accuracy	84.1	—	Unverified
2	code-davinci-002 175B (LEVER)	Accuracy	81.9	—	Unverified
3	RASAT+PICARD	Accuracy	75.5	—	Unverified
4	Graphix-3B + PICARD	Accuracy	74	—	Unverified
5	T5-3B + PICARD	Accuracy	71.9	—	Unverified
6	SADGA + GAP	Accuracy	70.1	—	Unverified
7	RATSQL + GAP	Accuracy	69.7	—	Unverified
8	RATSQL + Grammar-Augmented Pre-Training	Accuracy	69.6	—	Unverified
9	RATSQL + BERT	Accuracy	65.6	—	Unverified
10	Exact Set Matching	Accuracy	19.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Dynamic Least-to-Most Prompting	Exact Match	95	—	Unverified
2	LeAR	Exact Match	90.9	—	Unverified
3	T5-3B w/ Intermediate Representations	Exact Match	83.8	—	Unverified
4	Hierarchical Poset Decoding	Exact Match	69	—	Unverified
5	Universal Transformer	Exact Match	18.9	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReaRev	Accuracy	76.4	—	Unverified
2	NSM+h	Accuracy	74.3	—	Unverified
3	CBR-KBQA	Accuracy	70	—	Unverified
4	STAGG (Yih et al., 2016)	Accuracy	63.9	—	Unverified
5	T5-11B (Raffel et al., 2020)	Accuracy	56.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CABINET	Denotation accuracy (test)	89.5	—	Unverified
2	TAPEX-Large (weak supervision)	Denotation accuracy (test)	89.5	—	Unverified
3	ReasTAP-Large (weak supervision)	Denotation accuracy (test)	89.2	—	Unverified
4	NL2SQL-BERT	Accuracy	89	—	Unverified
5	TAPAS-Large (weak supervision)	Denotation accuracy (test)	83.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PhraseTransformer	Accuracy	90.4	—	Unverified
2	Tranx	Accuracy	86.2	—	Unverified
3	ASN (Rabinovich et al., 2017)	Accuracy	85.3	—	Unverified
4	ZH15 (Zhao and Huang, 2015)	Accuracy	84.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	coarse2fine	Accuracy	88.2	—	Unverified
2	PhraseTransformer	Accuracy	87.9	—	Unverified
3	Tranx	Accuracy	87.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN + RobeCzech	F1	92.36	—	Unverified
2	PERIN	F1	92.24	—	Unverified
3	HUJI-KU	F1	58	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	80.52	—	Unverified
2	HUJI-KU	F1	45	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	80.23	—	Unverified
2	HUJI-KU	F1	52	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	94.16	—	Unverified
2	HUJI-KU	F1	63	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	89.83	—	Unverified
2	HUJI-KU	F1	62	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	92.73	—	Unverified
2	HUJI-KU	F1	80	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	89.19	—	Unverified
2	HUJI-KU	F1	54	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAPEX-Large	Denotation Accuracy	74.5	—	Unverified
2	TAPAS-Large	Accuracy	67.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	76.4	—	Unverified
2	HUJI-KU	F1	73	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PERIN	F1	81.01	—	Unverified
2	HUJI-KU	F1	75	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	HSP	EM	66.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReasonBERTR	F1 Score	41.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MeMCE	Exact	40.3	—	Unverified