SOTAVerified|Agents Browse Leaderboard About

Sentence Completion

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–50 of 91 papers

Title	Date	Tasks	Status	Hype
Investigating Subtler Biases in LLMs: Ageism, Beauty, Institutional, and Nationality Bias in Generative Models	Sep 16, 2023	Age/Bias-conflictingBias Detection	CodeCode Available	0
Exploiting Language Models as a Source of Knowledge for Cognitive Agents	Sep 5, 2023	Natural Language InferenceQuestion Answering	—Unverified	0
I-WAS: a Data Augmentation Method with GPT-2 for Simile Detection	Aug 8, 2023	Data AugmentationLanguage Modeling	—Unverified	0
Stay on topic with Classifier-Free Guidance	Jun 30, 2023	Code GenerationCommon Sense Reasoning	—Unverified	0
ScoNe: Benchmarking Negation Reasoning in Language Models With Fine-Tuning and In-Context Learning	May 30, 2023	BenchmarkingIn-Context Learning	CodeCode Available	0
PaLM 2 Technical Report	May 17, 2023	Code GenerationCommon Sense Reasoning	CodeCode Available	0
BloombergGPT: A Large Language Model for Finance	Mar 30, 2023	Causal JudgmentCommon Sense Reasoning	CodeCode Available	0
Numeracy from Literacy: Data Science as an Emergent Skill from Large Language Models	Jan 31, 2023	DescriptiveFeature Importance	—Unverified	0
POIBERT: A Transformer-based Model for the Tour Recommendation Problem	Dec 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
Implicit causality in GPT-2: a case study	Dec 8, 2022	Language ModelingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 5 of 10Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	CompassMTL 567M with Tailor	Accuracy	96.1	—	Unverified
2	CompassMTL 567M	Accuracy	95.6	—	Unverified
3	DeBERTa-Large 304M (classification-based)	Accuracy	95.6	—	Unverified
4	GPT-4 (10-shot)	Accuracy	95.3	—	Unverified
5	LLaMA3+MoSLoRA	Accuracy	95	—	Unverified
6	LLaMA-2 13B + MixLoRA	Accuracy	94.7	—	Unverified
7	DeBERTa-Large 304M	Accuracy	94.7	—	Unverified
8	Unicorn 11B (fine-tuned)	Accuracy	93.9	—	Unverified
9	LLaMA-3 8B + MixLoRA	Accuracy	93.3	—	Unverified
10	LLaMA-2 7B + MixLoRA	Accuracy	93.1	—	Unverified