MedQA

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 80 papers

Title	Date	Tasks	Status	Hype
Biomed-Enriched: A Biomedical Dataset Enriched with LLMs for Pretraining and Extracting Rare and Hidden Content	Jun 25, 2025	ArticlesContinual Pretraining	—Unverified	0
Gazal-R1: Achieving State-of-the-Art Medical Reasoning with Parameter-Efficient Two-Stage Training	Jun 18, 2025	MedQAMMLU	—Unverified	0
LoRA-Mixer: Coordinate Modular LoRA Experts Through Serial Attention Routing	Jun 17, 2025	ARCCoLA	—Unverified	0
Med-PRM: Medical Reasoning Models with Stepwise, Guideline-verified Process Rewards	Jun 13, 2025	DiagnosticMedQA	—Unverified	0
Instruction Tuning and CoT Prompting for Contextual Medical QA with LLMs	Jun 13, 2025	Medical Question AnsweringMedQA	—Unverified	0
Med-REFL: Medical Reasoning Enhancement via Self-Corrected Fine-grained Reflection	Jun 11, 2025	Medical Question AnsweringMedQA	CodeCode Available	0
Enabling On-Device Medical AI Assistants via Input-Driven Saliency Adaptation	Jun 7, 2025	MedQAQuantization	—Unverified	0
Second Opinion Matters: Towards Adaptive Clinical AI via the Consensus of Expert Model Ensemble	May 29, 2025	Decision MakingMedQA	—Unverified	0
WiNGPT-3.0 Technical Report	May 23, 2025	DiagnosticMedQA	CodeCode Available	0
TAGS: A Test-Time Generalist-Specialist Framework with Retrieval-Augmented Reasoning and Verification	May 23, 2025	MedQA	CodeCode Available	0
Synthetic Data RL: Task Definition Is All You Need	May 18, 2025	AllGSM8K	CodeCode Available	2
MedCaseReasoning: Evaluating and learning diagnostic reasoning from clinical case reports	May 16, 2025	DiagnosticMath	CodeCode Available	1
Disentangling Reasoning and Knowledge in Medical Large Language Models	May 16, 2025	DiagnosticMedQA	—Unverified	0
What Does Neuro Mean to Cardio? Investigating the Role of Clinical Specialty Data in Medical LLMs	May 15, 2025	AllBenchmarking	—Unverified	0
A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage	Apr 28, 2025	MedQA	—Unverified	0
CliniChat: A Multi-Source Knowledge-Driven Framework for Clinical Interview Dialogue Reconstruction and Evaluation	Apr 14, 2025	MedQA	—Unverified	0
Evaluation of the phi-3-mini SLM for identification of texts related to medicine, health, and sports injuries	Mar 31, 2025	4kMedQA	—Unverified	0
Susceptibility of Large Language Models to User-Driven Factors in Medical Queries	Mar 26, 2025	DiagnosticMedQA	—Unverified	0
Bias Evaluation and Mitigation in Retrieval-Augmented Medical Question-Answering Systems	Mar 19, 2025	counterfactualDecision Making	—Unverified	0
MDTeamGPT: A Self-Evolving LLM-based Multi-Agent Framework for Multi-Disciplinary Team Medical Consultation	Mar 18, 2025	MedQA	—Unverified	0
Correctness Coverage Evaluation for Medical Multiple-Choice Question Answering Based on the Enhanced Conformal Prediction Framework	Mar 7, 2025	Conformal PredictionMedical Question Answering	—Unverified	0
Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support	Feb 25, 2025	Decision MakingDiagnostic	CodeCode Available	2
AutoMedPrompt: A New Framework for Optimizing LLM Medical Prompts Using Textual Gradients	Feb 21, 2025	MedQAPrompt Engineering	—Unverified	0
Agentic Medical Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge	Feb 18, 2025	Graph GenerationKnowledge Graphs	—Unverified	0
OctoTools: An Agentic Framework with Extensible Tools for Complex Reasoning	Feb 16, 2025	MedQAMMLU	—Unverified	0

Show:10 25 50

← PrevPage 1 of 4Next →

No leaderboard results yet.