valid

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 3589 papers

Title	Date	Tasks	Status
The 4th Dimension for Scaling Model Size	Jun 23, 2025	modelvalid	—Unverified
Broad Validity of the First-Order Approach in Moral Hazard	Jun 23, 2025	valid	—Unverified
Auto-Regressive Surface Cutting	Jun 22, 2025	valid	—Unverified
Symbolic Reduction for Formal Synthesis of Global Lyapunov Functions	Jun 22, 2025	Design Synthesisvalid	—Unverified
Identifying economic narratives in large text corpora -- An integrated approach using Large Language Models	Jun 18, 2025	ArticlesSemantic Role Labeling	—Unverified
Performative Validity of Recourse Explanations	Jun 18, 2025	counterfactualvalid	—Unverified
Probabilistic Trajectory GOSPA: A Metric for Uncertainty-Aware Multi-Object Tracking Performance Evaluation	Jun 18, 2025	Multi-Object TrackingObject Tracking	—Unverified
S^4C: Speculative Sampling with Syntactic and Semantic Coherence for Efficient Inference of Large Language Models	Jun 17, 2025	Text Generationvalid	—Unverified
Reimagining Target-Aware Molecular Generation through Retrieval-Enhanced Aligned Diffusion	Jun 17, 2025	Drug DesignDrug Discovery	—Unverified
On the relationship between prediction intervals, tests of sharp nulls and inference on realized treatment effects in settings with few treated units	Jun 17, 2025	Prediction Intervalsvalid	—Unverified
HypER: Literature-grounded Hypothesis Generation and Distillation with Provenance	Jun 15, 2025	Language ModelingLanguage Modelling	—Unverified
Geometric Jensen-Shannon Divergence Between Gaussian Measures On Hilbert Space	Jun 12, 2025	valid	—Unverified
Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?	Jun 12, 2025	Property Predictionvalid	—Unverified
General Reference Frame Identification and Transformation in Unbalanced Power Systems	Jun 12, 2025	valid	—Unverified
Step-by-step Instructions and a Simple Tabular Output Format Improve the Dependency Parsing Accuracy of LLMs	Jun 11, 2025	Dependency ParsingHallucination	CodeCode Available
Generalizing Supervised Contrastive learning: A Projection Perspective	Jun 11, 2025	Contrastive LearningRepresentation Learning	—Unverified
Vector Representations of Vessel Trees	Jun 11, 2025	GPUvalid	—Unverified
Employing self-supervised learning models for cross-linguistic child speech maturity classification	Jun 10, 2025	Self-Supervised Learningvalid	CodeCode Available
Asymptotic Normality of Infinite Centered Random Forests -Application to Imbalanced Classification	Jun 10, 2025	imbalanced classificationvalid	—Unverified
Policy-Based Trajectory Clustering in Offline Reinforcement Learning	Jun 10, 2025	ClusteringD4RL	—Unverified
AutoSDT: Scaling Data-Driven Discovery Tasks Toward Open Co-Scientists	Jun 9, 2025	scientific discoveryvalid	—Unverified
Ensuring Reliability of Curated EHR-Derived Data: The Validation of Accuracy for LLM/ML-Extracted Information and Data (VALID) Framework	Jun 9, 2025	BenchmarkingFairness	—Unverified
PhysiInter: Integrating Physical Mapping for High-Fidelity Human Interaction Generation	Jun 9, 2025	Motion Generationvalid	—Unverified
Language Models over Canonical Byte-Pair Encodings	Jun 9, 2025	valid	—Unverified
Can LLMs Generate Reliable Test Case Generators? A Study on Competition-Level Programming Problems	Jun 7, 2025	Code Generationvalid	—Unverified
Inference on the value of a linear program	Jun 7, 2025	valid	—Unverified
On Efficient Estimation of Distributional Treatment Effects under Covariate-Adaptive Randomization	Jun 6, 2025	regressionvalid	CodeCode Available
Speech Neurophysiology in Realistic Contexts: Big Hype or Big Leap?	Jun 5, 2025	valid	—Unverified
Does It Make Sense to Speak of Introspection in Large Language Models?	Jun 5, 2025	valid	—Unverified
SQLens: An End-to-End Framework for Error Detection and Correction in Text-to-SQL	Jun 4, 2025	Text to SQLText-To-SQL	—Unverified
DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience	Jun 4, 2025	Efficient ExplorationEquation Discovery	—Unverified
DRE: An Effective Dual-Refined Method for Integrating Small and Large Language Models in Open-Domain Dialogue Evaluation	Jun 4, 2025	Dialogue Evaluationvalid	—Unverified
Pi-SQL: Enhancing Text-to-SQL with Fine-Grained Guidance from Pivot Programming Languages	Jun 1, 2025	Text to SQLText-To-SQL	—Unverified
Quantization-based Bounds on the Wasserstein Metric	Jun 1, 2025	Computational EfficiencyDomain Adaptation	—Unverified
Behavioral Augmentation of UML Class Diagrams: An Empirical Study of Large Language Models for Method Generation	Jun 1, 2025	Model SelectionPrompt Engineering	CodeCode Available
Clinical Annotations for Automatic Stuttering Severity Assessment	May 31, 2025	valid	CodeCode Available
CSVQA: A Chinese Multimodal Benchmark for Evaluating STEM Reasoning Capabilities of VLMs	May 30, 2025	DiagnosticImage Comprehension	—Unverified
Stable Thompson Sampling: Valid Inference via Variance Inflation	May 29, 2025	Decision MakingThompson Sampling	—Unverified
Conformal Object Detection by Sequential Risk Control	May 29, 2025	Conformal PredictionObject	—Unverified
Generalizability vs. Counterfactual Explainability Trade-Off	May 29, 2025	counterfactualvalid	—Unverified
Maximum Likelihood Learning of Latent Dynamics Without Reconstruction	May 29, 2025	Schedulingvalid	—Unverified
What Has Been Lost with Synthetic Evaluation?	May 28, 2025	NegationReading Comprehension	—Unverified
Automatic Transmission for LLM Tiers: Optimizing Cost and Accuracy in Large Language Models	May 27, 2025	valid	CodeCode Available
STACI: Spatio-Temporal Aleatoric Conformal Inference	May 27, 2025	Gaussian ProcessesGPU	—Unverified
PrivATE: Differentially Private Confidence Intervals for Average Treatment Effects	May 27, 2025	Privacy PreservingUncertainty Quantification	—Unverified
On the Robustness of RSMA to Adversarial BD-RIS-Induced Interference	May 26, 2025	valid	—Unverified
We Need to Measure Data Diversity in NLP -- Better and Broader	May 26, 2025	Diversityvalid	—Unverified
Regret Analysis of Average-Reward Unichain MDPs via an Actor-Critic Approach	May 26, 2025	TARvalid	—Unverified
PAMD: Plausibility-Aware Motion Diffusion Model for Long Dance Generation	May 26, 2025	valid	—Unverified
Collision- and Reachability-Aware Multi-Robot Control with Grounded LLM Planners	May 26, 2025	MuJoCovalid	—Unverified

Show:10 25 50

← PrevPage 10 of 72Next →

No leaderboard results yet.