Automated Theorem Proving

The goal of Automated Theorem Proving is to automatically generate a proof, given a conjecture (the target theorem) and a knowledge base of known facts, all expressed in a formal language. Automated Theorem Proving is useful in a wide range of applications, including the verification and synthesis of software and hardware systems.

Source: Learning to Prove Theorems by Learning to Generate Theorems

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 288 papers

Title	Date	Tasks	Status
Verifier Theory and Unverifiability	Sep 1, 2016	Automated Theorem ProvingGeneral Classification	—Unverified
Vulnerability Detection: From Formal Verification to Large Language Models and Hybrid Approaches: A Comprehensive Overview	Mar 13, 2025	Automated Theorem Provingsoftware testing	—Unverified
Wu's Method can Boost Symbolic AI to Rival Silver Medalists and AlphaGeometry to Outperform Gold Medalists at IMO Geometry	Apr 9, 2024	Automated Theorem ProvingCPU	—Unverified
Local Look-Ahead Guidance via Verifier-in-the-Loop for Automated Theorem Proving	Mar 12, 2025	Automated Theorem ProvingReinforcement Learning (RL)	—Unverified
Logically Sound Arguments for the Effectiveness of ML Safety Measures	Nov 4, 2021	Automated Theorem Proving	—Unverified
Logical Rule Induction and Theory Learning Using Neural Theorem Proving	Sep 6, 2018	Automated Theorem Proving	—Unverified
Machine Learner for Automated Reasoning 0.4 and 0.5	Feb 11, 2014	Automated Theorem Proving	—Unverified
Magnushammer: A Transformer-Based Approach to Premise Selection	Mar 8, 2023	Automated Theorem ProvingLanguage Modeling	—Unverified
Math Agents: Computational Infrastructure, Mathematical Embedding, and Genomics	Jul 4, 2023	Automated Theorem ProvingMath	—Unverified
math-PVS: A Large Language Model Framework to Map Scientific Publications to PVS Theories	Oct 25, 2023	Automated Theorem ProvingLanguage Modeling	—Unverified
MATP-BENCH: Can MLLM Be a Good Automated Theorem Prover for Multimodal Problems?	Jun 6, 2025	Automated Theorem ProvingVisual Reasoning	—Unverified
miniCodeProps: a Minimal Benchmark for Proving Code Properties	Jun 16, 2024	AI AgentAutomated Theorem Proving	—Unverified
ML + FV = ? A Survey on the Application of Machine Learning to Formal Verification	Jun 10, 2018	Automated Theorem ProvingBIG-bench Machine Learning	—Unverified
Modeling in OWL 2 without Restrictions	Dec 12, 2012	Automated Theorem Proving	—Unverified
Monte Carlo Tableau Proof Search	Nov 18, 2016	Automated Theorem Proving	—Unverified
Multimodal Logical Inference System for Visual-Textual Entailment	Jun 10, 2019	Automated Theorem ProvingNatural Language Inference	—Unverified
Multi-Task Learning with Multi-Task Optimization	Mar 24, 2024	Automated Theorem Provingimage-classification	—Unverified
Natural Solution to FraCaS Entailment Problems	Aug 1, 2016	Automated Theorem ProvingNatural Language Inference	—Unverified
Neural Theorem Proving: Generating and Structuring Proofs for Formal Verification	Apr 23, 2025	Automated Theorem Proving	—Unverified
NIL: Learning Nonlinear Interpolants	May 28, 2019	Automated Theorem Proving	—Unverified
On-demand Injection of Lexical Knowledge for Recognising Textual Entailment	Apr 1, 2017	Automated Theorem ProvingInformation Retrieval	—Unverified
On Quantified Modal Theorem Proving for Modeling Ethics	Dec 30, 2019	Automated Theorem ProvingEthics	—Unverified
Performance Guarantees for Schatten-p Quasi-Norm Minimization in Recovery of Low-Rank Matrices	Jul 14, 2014	Automated Theorem Proving	—Unverified
Planning as Theorem Proving with Heuristics	Mar 23, 2023	Automated Theorem Proving	—Unverified
Probabilistic unifying relations for modelling epistemic and aleatoric uncertainty: semantics and automated reasoning with theorem proving	Mar 16, 2023	Automated Theorem ProvingProbabilistic Programming	—Unverified
Proceedings 10th International Workshop on Theorem Proving Components for Educational Software	Feb 2, 2022	Automated Theorem Proving	—Unverified
Proceedings 11th International Workshop on Theorem Proving Components for Educational Software	Mar 9, 2023	Automated Theorem Proving	—Unverified
Proceedings 12th International Workshop on Theorem proving components for Educational software	Apr 4, 2024	Automated Theorem Proving	—Unverified
Proceedings 35th International Conference on Logic Programming (Technical Communications)	Sep 17, 2019	Automated Theorem ProvingData Integration	—Unverified
Proceedings 36th International Conference on Logic Programming (Technical Communications)	Sep 19, 2020	Automated Theorem ProvingData Integration	—Unverified
Proceedings 37th International Conference on Logic Programming (Technical Communications)	Sep 15, 2021	Automated Theorem ProvingData Integration	—Unverified
Proceedings 38th International Conference on Logic Programming	Aug 4, 2022	Automated Theorem ProvingData Integration	—Unverified
Proceedings 6th International Workshop on Theorem proving components for Educational software	Mar 2, 2018	Automated Theorem Proving	—Unverified
Proceedings 7th International Workshop on Theorem proving components for Educational software	Mar 29, 2019	Automated Theorem Proving	—Unverified
Proceedings 8th International Workshop on Theorem Proving Components for Educational Software	Feb 27, 2020	Automated Theorem Proving	—Unverified
Proceedings 9th International Workshop on Theorem Proving Components for Educational Software	Oct 28, 2020	Automated Theorem Proving	—Unverified
Proceedings of the 13th International Conference on Automated Deduction in Geometry	Dec 28, 2021	Automated Theorem Proving	—Unverified
Proceedings of the Fifth Workshop on Proof eXchange for Theorem Proving	Dec 4, 2017	Automated Theorem Proving	—Unverified
0-1 laws for pattern occurrences in phylogenetic trees and networks	Feb 7, 2024	10-shot image generation	—Unverified
Proof Extraction for Logical Neural Networks	Oct 8, 2021	Automated Theorem Proving	—Unverified
Proof Flow: Preliminary Study on Generative Flow Network Language Model Tuning for Formal Reasoning	Oct 17, 2024	Automated Theorem ProvingLanguage Modeling	—Unverified
ProofNet++: A Neuro-Symbolic System for Formal Proof Verification with Self-Correction	May 30, 2025	Automated Theorem Proving	—Unverified
Proof Recommendation System for the HOL4 Theorem Prover	Dec 31, 2024	Automated Theorem ProvingRecommendation Systems	—Unverified
Property Invariant Embedding for Automated Reasoning	Nov 27, 2019	Automated Theorem ProvingGraph Neural Network	—Unverified
LLM-based Automated Theorem Proving Hinges on Scalable Synthetic Data Generation	May 17, 2025	Automated Theorem ProvingSynthetic Data Generation	CodeCode Available
Scaling Synthetic Logical Reasoning Datasets with Context-Sensitive Declarative Grammars	Jun 16, 2024	Automated Theorem ProvingLogical Reasoning	CodeCode Available
Lemmas: Generation, Selection, Application	Mar 10, 2023	Automated Theorem Proving	CodeCode Available
Logically Consistent Adversarial Attacks for Soft Theorem Provers	Apr 29, 2022	Automated Theorem Proving	CodeCode Available
Deep Reinforcement Learning for Synthesizing Functions in Higher-Order Logic	Oct 25, 2019	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available
Lectures on Jacques Herbrand as a Logician	Feb 26, 2009	Automated Theorem ProvingFormal Logic	CodeCode Available

Show:10 25 50

← PrevPage 5 of 6Next →

All datasets miniF2F-test miniF2F-valid HolStep (Conditional)HOList benchmark HolStep (Unconditional)Metamath set.mm miniF2F-curriculum CompCert CoqGym

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Kimina-Prover-Preview	cumulative	80.74	—	Unverified
2	ProofAug	cumulative	66	—	Unverified
3	DeepSeek-Prover-V1.5	cumulative	63.5	—	Unverified
4	Subgoal-XL	cumulative	56.1	—	Unverified
5	DeepSeek-Prover	cumulative	52	—	Unverified
6	Lyra + GPT-4	cumulative	47.1	—	Unverified
7	LEGO-Prover ChatGPT	cumulative	47.1	—	Unverified
8	Decomposing the Enigma	cumulative	45.5	—	Unverified
9	Evariste	cumulative	41	—	Unverified
10	Evariste-7d	cumulative	40.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evariste	Pass@64	58.6	—	Unverified
2	LEGO-Prover ChatGPT	Pass@100	57	—	Unverified
3	Lyra + GPT-4	Pass@100	52	—	Unverified
4	Evariste-7d	Pass@64	47.5	—	Unverified
5	GPT-f	Pass@64	47.3	—	Unverified
6	Evariste-1d	Pass@64	46.7	—	Unverified
7	DSP (62B Minerva informal)	Pass@100	43.9	—	Unverified
8	Lean GPT-f	Pass@8	29.3	—	Unverified
9	Lean tidy	Pass@1	16.8	—	Unverified
10	Metamath GPT-f	Pass@8	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MPNN-DagLSTM	Classification Accuracy	0.92	—	Unverified
2	FormulaNet	Classification Accuracy	0.9	—	Unverified
3	FormulaNet-basic	Classification Accuracy	0.89	—	Unverified
4	Siamese 1D CNN-LSTM	Classification Accuracy	0.83	—	Unverified
5	Siamese 1D CNN	Classification Accuracy	0.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	4-hop GNN, sub-expression sharing	Percentage correct	49.95	—	Unverified
2	Tactic Dependent Loop	Percentage correct	38.88	—	Unverified
3	BoW2 (extra -ves)	Percentage correct	36.55	—	Unverified
4	Deeper Wider WaveNet	Percentage correct	32.65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FormulaNet	Classification Accuracy	0.9	—	Unverified
2	FormulaNet-basic	Classification Accuracy	0.89	—	Unverified
3	1D CNN	Classification Accuracy	0.83	—	Unverified
4	1D CNN-LSTM	Classification Accuracy	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evariste	Pass@32	72.4	—	Unverified
2	GPT-f	Percentage correct	56.2	—	Unverified
3	MetaGen-IL + Holophrasm	Percentage correct	22.1	—	Unverified
4	Holophrasm	Percentage correct	14.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evariste-7d	Pass@64	42.5	—	Unverified
2	Evariste-1d	Pass@64	33.6	—	Unverified
3	Evariste	Pass@64	32.1	—	Unverified
4	GPT-f	Pass@64	30.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Proverbot9001	Percentage correct	19.36	—	Unverified
2	CoqGym/ASTactic	Percentage correct	4.99	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ASTactic	Percentage correct	12.2	—	Unverified