Multiple-choice

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1107 papers

Title	Date	Tasks	Status
LMVE at SemEval-2020 Task 4: Commonsense Validation and Explanation using Pretraining Language Model	Jul 6, 2020	Common Sense ReasoningLanguage Modeling	—Unverified
Localizing AI: Evaluating Open-Weight Language Models for Languages of Baltic States	Jan 7, 2025	Machine TranslationMultiple-choice	—Unverified
Unlocking Video-LLM via Agent-of-Thoughts Distillation	Dec 2, 2024	Language ModelingLanguage Modelling	—Unverified
Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering	Mar 23, 2025	BenchmarkingChart Question Answering	—Unverified
LogiDynamics: Unraveling the Dynamics of Logical Inference in Large Language Model Reasoning	Feb 16, 2025	Analogical questionsIn-Context Learning	—Unverified
LOKI: A Comprehensive Synthetic Data Detection Benchmark using Large Multimodal Models	Oct 13, 2024	Multiple-choice	—Unverified
An Add-On for Empowering Google Forms to be an Automatic Question Generator in Online Assessments	Sep 21, 2021	Multiple-choice	—Unverified
Unsupervised Explanation Generation for Machine Reading Comprehension	Nov 13, 2020	Explanation GenerationMachine Reading Comprehension	—Unverified
Unsupervised multiple-choice question generation for out-of-domain Q\&A fine-tuning	Nov 16, 2021	Multiple-choiceQuestion Answering	—Unverified
LongPerceptualThoughts: Distilling System-2 Reasoning for System-1 Perception	Apr 21, 2025	MathMMLU	—Unverified
LongReason: A Synthetic Long-Context Reasoning Benchmark via Context Expansion	Jan 25, 2025	Multiple-choiceReading Comprehension	—Unverified
LookAlike: Consistent Distractor Generation in Math MCQs	May 3, 2025	Distractor GenerationMath	—Unverified
Looking Beyond Sentence-Level Natural Language Inference for Question Answering and Text Summarization	Jun 1, 2021	Multiple-choiceNatural Language Inference	—Unverified
Looking Beyond Short-Premise Natural Language Inference for Downstream Tasks	Dec 4, 2020	Multiple-choiceNatural Language Inference	—Unverified
Unsupervised multiple-choice question generation for out-of-domain Q&A fine-tuning	May 1, 2022	Multiple-choiceQuestion Answering	—Unverified
Make a Choice! Knowledge Base Question Answering with In-Context Learning	May 23, 2023	In-Context LearningKnowledge Base Question Answering	—Unverified
Amobee at SemEval-2019 Tasks 5 and 6: Multiple Choice CNN Over Contextual Embedding	Apr 17, 2019	Multiple-choice	—Unverified
MANTA: A Large-Scale Multi-View and Visual-Text Anomaly Detection Dataset for Tiny Objects	Dec 6, 2024	2kAnomaly Detection	—Unverified
Unsupervised multiple choices question answering via universal corpus	Feb 27, 2024	FormKnowledge Graphs	—Unverified
MateInfoUB: A Real-World Benchmark for Testing LLMs in Competitive, Multilingual, and Multimodal Educational Tasks	Jul 3, 2025	FairnessMultiple-choice	—Unverified
MaterialBENCH: Evaluating College-Level Materials Science Problem-Solving Abilities of Large Language Models	Sep 5, 2024	Multiple-choice	—Unverified
Math Multiple Choice Question Generation via Human-Large Language Model Collaboration	May 1, 2024	Language ModelingLanguage Modelling	—Unverified
MCL-GAN: Generative Adversarial Networks with Multiple Specialized Discriminators	Jul 15, 2021	Generative Adversarial NetworkMultiple-choice	—Unverified
MCQA-Eval: Efficient Confidence Evaluation in NLG with Gold-Standard Correctness Labels	Feb 20, 2025	Multiple-choiceText Generation	—Unverified
MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation	May 13, 2024	In-Context LearningMultiple-choice	—Unverified
Measuring Semantic Similarity by Latent Relational Analysis	Aug 10, 2005	Multiple-choiceSemantic Similarity	—Unverified
MedGPT: Medical Concept Prediction from Clinical Narratives	Jul 7, 2021	Multiple-choicenamed-entity-recognition	—Unverified
MedGUIDE: Benchmarking Clinical Decision-Making in Large Language Models	May 16, 2025	BenchmarkingDecision Making	—Unverified
MeDiaQA: A Question Answering Dataset on Medical Dialogues	Aug 18, 2021	Multiple-choiceQuestion Answering	—Unverified
MedKP: Medical Dialogue with Knowledge Enhancement and Clinical Pathway Encoding	Mar 11, 2024	Dialogue GenerationMultiple-choice	—Unverified
A Method for Building a Commonsense Inference Dataset based on Basic Events	Nov 1, 2020	Multiple-choiceTransfer Learning	—Unverified
Unveiling Cultural Blind Spots: Analyzing the Limitations of mLLMs in Procedural Text Comprehension	Feb 20, 2025	Multiple-choiceReading Comprehension	—Unverified
Med-RLVR: Emerging Medical Reasoning from a 3B base model via reinforcement Learning	Feb 27, 2025	MathMedical Question Answering	—Unverified
AmazUtah_NLP at SemEval-2024 Task 9: A MultiChoice Question Answering System for Commonsense Defying Reasoning	May 16, 2024	Multiple-choiceQuestion Answering	—Unverified
UrbanVideo-Bench: Benchmarking Vision-Language Models on Embodied Intelligence with Video Data in Urban Spaces	Mar 8, 2025	Benchmarkingcounterfactual	—Unverified
AlignMMBench: Evaluating Chinese Multimodal Alignment in Large Vision-Language Models	Jun 13, 2024	Multiple-choice	—Unverified
Meta Sequence Learning for Generating Adequate Question-Answer Pairs	Oct 4, 2020	Multiple-choicenamed-entity-recognition	—Unverified
MHQA: A Diverse, Knowledge Intensive Mental Health Question Answering Challenge for Language Models	Feb 21, 2025	BenchmarkingDiagnostic	—Unverified
MIBench: Evaluating Multimodal Large Language Models over Multiple Images	Jul 21, 2024	In-Context LearningMultiple-choice	—Unverified
Use neural networks to recognize students' handwritten letters and incorrect symbols	Sep 12, 2023	Multiple-choice	—Unverified
Using contradictions improves question answering systems	Sep 28, 2022	Multiple-choiceNatural Language Inference	—Unverified
Using Large Language Models for Automated Grading of Student Writing about Science	Dec 25, 2024	AstronomyMultiple-choice	—Unverified
Are Machines Better at Complex Reasoning? Unveiling Human-Machine Inference Gaps in Entailment Verification	Feb 6, 2024	BenchmarkingMultiple-choice	—Unverified
MINI-LLM: Memory-Efficient Structured Pruning for Large Language Models	Jul 16, 2024	GPUMultiple-choice	—Unverified
Mitigating Bias for Question Answering Models by Tracking Bias Influence	Oct 13, 2023	Multiple-choiceMulti-Task Learning	—Unverified
Mitigating Selection Bias with Node Pruning and Auxiliary Options	Sep 27, 2024	Multiple-choiceSelection bias	—Unverified
MixQG: Neural Question Generation with Mixed Answer Types	Jan 16, 2022	Multiple-choiceQuestion Answering	—Unverified
ZeroTuning: Unlocking the Initial Token's Power to Enhance Large Language Models Without Training	May 16, 2025	Multiple-choicetext-classification	—Unverified
A Comparative Study of AI-Generated (GPT-4) and Human-crafted MCQs in Programming Education	Dec 5, 2023	Multiple-choice	—Unverified
A Joint-Reasoning based Disease Q&A System	Jan 6, 2024	Knowledge GraphsMisinformation	—Unverified

Show:10 25 50

← PrevPage 16 of 23Next →

No leaderboard results yet.