SOTAVerified|Agents Browse Leaderboard About Blog

Sentence Completion

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 31–40 of 91 papers

Title	Date	Tasks	Status	Hype
Numeracy from Literacy: Data Science as an Emergent Skill from Large Language Models	Jan 31, 2023	DescriptiveFeature Importance	—Unverified	0
POIBERT: A Transformer-based Model for the Tour Recommendation Problem	Dec 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
Implicit causality in GPT-2: a case study	Dec 8, 2022	Language ModelingLanguage Modelling	—Unverified	0
Crosslingual Generalization through Multitask Finetuning	Nov 3, 2022	Coreference ResolutionCross-Lingual Transfer	CodeCode Available	2
Two is Better than Many? Binary Classification as an Effective Approach to Multi-Choice Question Answering	Oct 29, 2022	Binary ClassificationQuestion Answering	CodeCode Available	1
Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language Models	Oct 28, 2022	Common Sense ReasoningCoreference Resolution	—Unverified	0
DiscoSense: Commonsense Reasoning with Discourse Connectives	Oct 22, 2022	Sentence Completion	CodeCode Available	0
Task Compass: Scaling Multi-task Pre-training with Task Prefix	Oct 12, 2022	Common Sense ReasoningData Augmentation	CodeCode Available	1
Guess the Instruction! Flipped Learning Makes Language Models Stronger Zero-Shot Learners	Oct 6, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
Effidit: Your AI Writing Assistant	Aug 3, 2022	Keywords to SentencesRetrieval	—Unverified	0

Show:10 25 50

← PrevPage 4 of 10Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CompassMTL 567M with Tailor	Accuracy	96.1	—	Unverified
2	CompassMTL 567M	Accuracy	95.6	—	Unverified
3	DeBERTa-Large 304M (classification-based)	Accuracy	95.6	—	Unverified
4	GPT-4 (10-shot)	Accuracy	95.3	—	Unverified
5	LLaMA3+MoSLoRA	Accuracy	95	—	Unverified
6	LLaMA-2 13B + MixLoRA	Accuracy	94.7	—	Unverified
7	DeBERTa-Large 304M	Accuracy	94.7	—	Unverified
8	Unicorn 11B (fine-tuned)	Accuracy	93.9	—	Unverified
9	LLaMA-3 8B + MixLoRA	Accuracy	93.3	—	Unverified
10	LLaMA-2 7B + MixLoRA	Accuracy	93.1	—	Unverified