Automated Theorem Proving

The goal of Automated Theorem Proving is to automatically generate a proof, given a conjecture (the target theorem) and a knowledge base of known facts, all expressed in a formal language. Automated Theorem Proving is useful in a wide range of applications, including the verification and synthesis of software and hardware systems.

Source: Learning to Prove Theorems by Learning to Generate Theorems

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 288 papers

Title	Date	Tasks	Status	Score
Towards Finding Longer Proofs	May 30, 2019	Automated Theorem Provingreinforcement-learning	CodeCode Available	5
Aplib: Tactical Programming of Intelligent Agents	Nov 12, 2019	Automated Theorem Proving	CodeCode Available	5
Guiding Inferences in Connection Tableau by Recurrent Neural Networks	May 20, 2019	Automated Theorem ProvingMachine Translation	CodeCode Available	5
Automated Completion of Statements and Proofs in Synthetic Geometry: an Approach based on Constraint Solving	Jan 22, 2024	Automated Theorem Proving	CodeCode Available	5
TRIGO: Benchmarking Formal Mathematical Proof Reduction for Generative Language Models	Oct 16, 2023	Automated Theorem ProvingBenchmarking	CodeCode Available	5
Verification and Refinement of Natural Language Explanations through LLM-Symbolic Theorem Proving	May 2, 2024	Automated Theorem ProvingNatural Language Inference	CodeCode Available	5
MIRB: Mathematical Information Retrieval Benchmark	May 21, 2025	Automated Theorem ProvingInformation Retrieval	CodeCode Available	5
WithdrarXiv: A Large-Scale Dataset for Retraction Study	Dec 4, 2024	Automated Theorem ProvingClaim Verification	CodeCode Available	5
Hierarchical Attention Generates Better Proofs	Apr 27, 2025	Automated Theorem ProvingMathematical Proofs	CodeCode Available	5
Neural Theorem Proving: Generating and Structuring Proofs for Formal Verification	Apr 23, 2025	Automated Theorem Proving	—Unverified	0
NIL: Learning Nonlinear Interpolants	May 28, 2019	Automated Theorem Proving	—Unverified	0
On-demand Injection of Lexical Knowledge for Recognising Textual Entailment	Apr 1, 2017	Automated Theorem ProvingInformation Retrieval	—Unverified	0
On Quantified Modal Theorem Proving for Modeling Ethics	Dec 30, 2019	Automated Theorem ProvingEthics	—Unverified	0
Performance Guarantees for Schatten-p Quasi-Norm Minimization in Recovery of Low-Rank Matrices	Jul 14, 2014	Automated Theorem Proving	—Unverified	0
Planning as Theorem Proving with Heuristics	Mar 23, 2023	Automated Theorem Proving	—Unverified	0
Probabilistic unifying relations for modelling epistemic and aleatoric uncertainty: semantics and automated reasoning with theorem proving	Mar 16, 2023	Automated Theorem ProvingProbabilistic Programming	—Unverified	0
Proceedings 10th International Workshop on Theorem Proving Components for Educational Software	Feb 2, 2022	Automated Theorem Proving	—Unverified	0
Proceedings 11th International Workshop on Theorem Proving Components for Educational Software	Mar 9, 2023	Automated Theorem Proving	—Unverified	0
Proceedings 12th International Workshop on Theorem proving components for Educational software	Apr 4, 2024	Automated Theorem Proving	—Unverified	0
Proceedings 35th International Conference on Logic Programming (Technical Communications)	Sep 17, 2019	Automated Theorem ProvingData Integration	—Unverified	0
Proceedings 36th International Conference on Logic Programming (Technical Communications)	Sep 19, 2020	Automated Theorem ProvingData Integration	—Unverified	0
Proceedings 37th International Conference on Logic Programming (Technical Communications)	Sep 15, 2021	Automated Theorem ProvingData Integration	—Unverified	0
Proceedings 38th International Conference on Logic Programming	Aug 4, 2022	Automated Theorem ProvingData Integration	—Unverified	0
Proceedings 6th International Workshop on Theorem proving components for Educational software	Mar 2, 2018	Automated Theorem Proving	—Unverified	0
Proceedings 7th International Workshop on Theorem proving components for Educational software	Mar 29, 2019	Automated Theorem Proving	—Unverified	0
Proceedings 8th International Workshop on Theorem Proving Components for Educational Software	Feb 27, 2020	Automated Theorem Proving	—Unverified	0
Proceedings 9th International Workshop on Theorem Proving Components for Educational Software	Oct 28, 2020	Automated Theorem Proving	—Unverified	0
Proceedings of the 13th International Conference on Automated Deduction in Geometry	Dec 28, 2021	Automated Theorem Proving	—Unverified	0
Proceedings of the Fifth Workshop on Proof eXchange for Theorem Proving	Dec 4, 2017	Automated Theorem Proving	—Unverified	0
Proceedings The 13th International Workshop on Theorem proving components for Educational software	May 7, 2025	Automated Theorem Proving	—Unverified	0
Proof Extraction for Logical Neural Networks	Oct 8, 2021	Automated Theorem Proving	—Unverified	0
Proof Flow: Preliminary Study on Generative Flow Network Language Model Tuning for Formal Reasoning	Oct 17, 2024	Automated Theorem ProvingLanguage Modeling	—Unverified	0
ProofNet++: A Neuro-Symbolic System for Formal Proof Verification with Self-Correction	May 30, 2025	Automated Theorem Proving	—Unverified	0
Proof Recommendation System for the HOL4 Theorem Prover	Dec 31, 2024	Automated Theorem ProvingRecommendation Systems	—Unverified	0
Property Invariant Embedding for Automated Reasoning	Nov 27, 2019	Automated Theorem ProvingGraph Neural Network	—Unverified	0
Prover Agent: An Agent-based Framework for Formal Mathematical Proofs	Jun 24, 2025	AI AgentAutomated Theorem Proving	—Unverified	0
Proving the Coding Interview: A Benchmark for Formally Verified Code Generation	Feb 8, 2025	Automated Theorem ProvingCode Generation	—Unverified	0
Proving Theorems using Incremental Learning and Hindsight Experience Replay	Dec 20, 2021	Automated Theorem ProvingIncremental Learning	—Unverified	0
Quantum Machine Learning in Precision Medicine and Drug Discovery -- A Game Changer for Tailored Treatments?	Feb 25, 2025	Automated Theorem ProvingDrug Discovery	—Unverified	0
Rare Speed-up in Automatic Theorem Proving Reveals Tradeoff Between Computational Time and Information Value	Jun 14, 2015	Automated Theorem Proving	—Unverified	0
READ-EVAL-PRINT in Parallel and Asynchronous Proof-checking	Jul 8, 2013	Automated Theorem Proving	—Unverified	0
Reasoning Models Can Be Effective Without Thinking	Apr 14, 2025	Automated Theorem ProvingMathematical Problem-Solving	—Unverified	0
Reasoning Under Threat: Symbolic and Neural Techniques for Cybersecurity Verification	Mar 27, 2025	Automated Theorem ProvingFormal Logic	—Unverified	0
Reinforcement Learning of Theorem Proving	May 19, 2018	Automated Theorem Provingreinforcement-learning	—Unverified	0
Revealed Invariant Preference	Aug 8, 2024	Automated Theorem Proving	—Unverified	0
Review on DNA Strand Algebra and its Application	Mar 4, 2019	Automated Theorem Proving	—Unverified	0
Rewarding the Unlikely: Lifting GRPO Beyond Distribution Sharpening	Jun 3, 2025	Automated Theorem Proving	—Unverified	0
Robust Computer Algebra, Theorem Proving, and Oracle AI	Aug 8, 2017	Automated Theorem ProvingQuestion Answering	—Unverified	0
RocqStar: Leveraging Similarity-driven Retrieval and Agentic Systems for Rocq generation	May 28, 2025	Automated Theorem ProvingRetrieval	—Unverified	0
Scalable Neural Theorem Proving on Knowledge Bases and Natural Language	May 1, 2019	Automated Theorem ProvingLink Prediction	—Unverified	0

Show:10 25 50

← PrevPage 3 of 6Next →

All datasets miniF2F-test miniF2F-valid HolStep (Conditional)HOList benchmark HolStep (Unconditional)Metamath set.mm miniF2F-curriculum CompCert CoqGym

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Kimina-Prover-Preview	cumulative	80.74	—	Unverified
2	ProofAug	cumulative	66	—	Unverified
3	DeepSeek-Prover-V1.5	cumulative	63.5	—	Unverified
4	Subgoal-XL	cumulative	56.1	—	Unverified
5	DeepSeek-Prover	cumulative	52	—	Unverified
6	Lyra + GPT-4	cumulative	47.1	—	Unverified
7	LEGO-Prover ChatGPT	cumulative	47.1	—	Unverified
8	Decomposing the Enigma	cumulative	45.5	—	Unverified
9	Evariste	cumulative	41	—	Unverified
10	Evariste-7d	cumulative	40.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evariste	Pass@64	58.6	—	Unverified
2	LEGO-Prover ChatGPT	Pass@100	57	—	Unverified
3	Lyra + GPT-4	Pass@100	52	—	Unverified
4	Evariste-7d	Pass@64	47.5	—	Unverified
5	GPT-f	Pass@64	47.3	—	Unverified
6	Evariste-1d	Pass@64	46.7	—	Unverified
7	DSP (62B Minerva informal)	Pass@100	43.9	—	Unverified
8	Lean GPT-f	Pass@8	29.3	—	Unverified
9	Lean tidy	Pass@1	16.8	—	Unverified
10	Metamath GPT-f	Pass@8	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MPNN-DagLSTM	Classification Accuracy	0.92	—	Unverified
2	FormulaNet	Classification Accuracy	0.9	—	Unverified
3	FormulaNet-basic	Classification Accuracy	0.89	—	Unverified
4	Siamese 1D CNN-LSTM	Classification Accuracy	0.83	—	Unverified
5	Siamese 1D CNN	Classification Accuracy	0.82	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	4-hop GNN, sub-expression sharing	Percentage correct	49.95	—	Unverified
2	Tactic Dependent Loop	Percentage correct	38.88	—	Unverified
3	BoW2 (extra -ves)	Percentage correct	36.55	—	Unverified
4	Deeper Wider WaveNet	Percentage correct	32.65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FormulaNet	Classification Accuracy	0.9	—	Unverified
2	FormulaNet-basic	Classification Accuracy	0.89	—	Unverified
3	1D CNN	Classification Accuracy	0.83	—	Unverified
4	1D CNN-LSTM	Classification Accuracy	0.83	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evariste	Pass@32	72.4	—	Unverified
2	GPT-f	Percentage correct	56.2	—	Unverified
3	MetaGen-IL + Holophrasm	Percentage correct	22.1	—	Unverified
4	Holophrasm	Percentage correct	14.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Evariste-7d	Pass@64	42.5	—	Unverified
2	Evariste-1d	Pass@64	33.6	—	Unverified
3	Evariste	Pass@64	32.1	—	Unverified
4	GPT-f	Pass@64	30.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Proverbot9001	Percentage correct	19.36	—	Unverified
2	CoqGym/ASTactic	Percentage correct	4.99	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ASTactic	Percentage correct	12.2	—	Unverified