Logical Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 747 papers

Title	Date	Tasks	Status	Hype
Techniques for Symbol Grounding with SATNet	Jun 16, 2021	Logical ReasoningVisual Reasoning	CodeCode Available	0
Query Embedding on Hyper-relational Knowledge Graphs	Jun 15, 2021	Knowledge GraphsLink Prediction	CodeCode Available	1
Discriminative Reasoning for Document-level Relation Extraction	Jun 3, 2021	Document-level Relation ExtractionLogical Reasoning	CodeCode Available	1
SIRE: Separate Intra- and Inter-sentential Reasoning for Document-level Relation Extraction	Jun 3, 2021	Document-level Relation ExtractionLogical Reasoning	CodeCode Available	1
Volta at SemEval-2021 Task 9: Statement Verification and Evidence Finding with Tables using TAPAS and Transfer Learning	Jun 1, 2021	Logical ReasoningTransfer Learning	CodeCode Available	0
NeuralLog: Natural Language Inference with Joint Neural and Logical Reasoning	May 29, 2021	Deep LearningLanguage Modeling	CodeCode Available	1
Probabilistic Sufficient Explanations	May 21, 2021	Logical Reasoning	CodeCode Available	0
Fact-driven Logical Reasoning for Machine Reading Comprehension	May 21, 2021	Logical ReasoningMachine Reading Comprehension	CodeCode Available	1
Logic-Driven Context Extension and Data Augmentation for Logical Reasoning of Text	May 8, 2021	Data AugmentationLogical Reasoning	CodeCode Available	1
The General Theory of General Intelligence: A Pragmatic Patternist Perspective	Mar 28, 2021	ClusteringEthics	—Unverified	0
Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and Execution	Mar 26, 2021	AttributeLogical Reasoning	—Unverified	0
DAGN: Discourse-Aware Graph Network for Logical Reasoning	Mar 26, 2021	Logical ReasoningSentence	CodeCode Available	1
Context Transformer with Stacked Pointer Networks for Conversational Question Answering over Knowledge Graphs	Mar 13, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	0
Neural Sequence-to-grid Module for Learning Symbolic Rules	Jan 13, 2021	Logical Reasoning	CodeCode Available	0
A Closer Look at the Robustness of Vision-and-Language Pre-trained Models	Dec 15, 2020	Logical Reasoning	—Unverified	0
Bayes Meets Entailment and Prediction: Commonsense Reasoning with Non-monotonicity, Paraconsistency and Predictive Accuracy	Dec 15, 2020	Logical ReasoningRelation	—Unverified	0
Neurosymbolic AI: The 3rd Wave	Dec 10, 2020	Logical Reasoning	—Unverified	0
Handling Noisy Labels via One-Step Abductive Multi-Target Learning and Its Application to Helicobacter Pylori Segmentation	Nov 25, 2020	Logical Reasoning	—Unverified	0
Neural Software Analysis	Nov 16, 2020	Code CompletionLogical Reasoning	CodeCode Available	0
Natural Language Inference in Context -- Investigating Contextual Reasoning over Long Texts	Nov 10, 2020	Logical ReasoningNatural Language Inference	CodeCode Available	1
Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs	Oct 22, 2020	Complex Query AnsweringKnowledge Graphs	CodeCode Available	1
Axiom Learning and Belief Tracing for Transparent Decision Making in Robotics	Oct 20, 2020	Decision MakingLogical Reasoning	—Unverified	0
Measuring Systematic Generalization in Neural Proof Generation with Transformers	Sep 30, 2020	Automated Theorem ProvingLogical Reasoning	CodeCode Available	1
Neural Logic Reasoning	Aug 20, 2020	Logical ReasoningRecommendation Systems	CodeCode Available	1
Few-shot Visual Reasoning with Meta-analogical Contrastive Learning	Jul 23, 2020	Contrastive LearningLogical Reasoning	—Unverified	0
LogiQA: A Challenge Dataset for Machine Reading Comprehension with Logical Reasoning	Jul 16, 2020	Logical ReasoningMachine Reading Comprehension	CodeCode Available	1
Learning Syllogism with Euler Neural-Networks	Jul 14, 2020	Logical Reasoning	—Unverified	0
Medical idioms for clinical Bayesian network development	Jul 1, 2020	counterfactualCounterfactual Reasoning	—Unverified	0
Multi-source Meta Transfer for Low Resource Multiple-Choice Question Answering	Jul 1, 2020	Domain AdaptationLogical Reasoning	—Unverified	0
Matrix Shuffle-Exchange Networks for Hard 2D Tasks	Jun 29, 2020	Graph Neural NetworkImage Classification	CodeCode Available	0
Logical Neural Networks	Jun 23, 2020	Automated Theorem ProvingLogical Reasoning	CodeCode Available	1
ReCO: A Large Scale Chinese Reading Comprehension Dataset on Opinion	Jun 22, 2020	Causal InferenceChinese Reading Comprehension	CodeCode Available	1
A Probabilistic Model for Discriminative and Neuro-Symbolic Semi-Supervised Learning	Jun 10, 2020	Data AugmentationImage Augmentation	—Unverified	0
Mathematical Reasoning via Self-supervised Skip-tree Training	Jun 8, 2020	Language ModelingLanguage Modelling	—Unverified	0
Neural Collaborative Reasoning	May 16, 2020	Collaborative FilteringDecision Making	CodeCode Available	1
Bayesian Entailment Hypothesis: How Brains Implement Monotonic and Non-monotonic Reasoning	May 3, 2020	Logical ReasoningRelation	—Unverified	0
Logic and the 2-Simplicial Transformer	May 1, 2020	Deep Reinforcement LearningInductive Bias	CodeCode Available	1
Unifying Neural Learning and Symbolic Reasoning for Spinal Medical Report Generation	Apr 28, 2020	Decision MakingGenerative Adversarial Network	—Unverified	0
Multi-Step Inference for Reasoning Over Paragraphs	Apr 6, 2020	Logical Reasoning	—Unverified	0
Extending Automated Deduction for Commonsense Reasoning	Mar 29, 2020	BIG-bench Machine LearningLogical Reasoning	—Unverified	0
From Statistical Relational to Neuro-Symbolic Artificial Intelligence	Mar 18, 2020	Logical ReasoningPosition	—Unverified	0
Improving Certified Robustness via Statistical Learning with Logical Reasoning	Feb 28, 2020	BIG-bench Machine LearningLogical Reasoning	CodeCode Available	0
Cognitive Argumentation and the Suppression Task	Feb 24, 2020	Logical Reasoning	—Unverified	0
HypoML: Visual Analysis for Hypothesis-based Evaluation of Machine Learning Models	Feb 12, 2020	BIG-bench Machine LearningLogical Reasoning	—Unverified	0
ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning	Feb 11, 2020	Logical ReasoningLogical Reasoning Question Answering	CodeCode Available	1
A (Simplified) Supreme Being Necessarily Exists, says the Computer: Computationally Explored Variants of Gödel's Ontological Argument	Jan 14, 2020	Logical Reasoning	—Unverified	0
Generating Programmatic Referring Expressions via Program Synthesis	Jan 1, 2020	Enumerative SearchLogical Reasoning	CodeCode Available	0
Quantum Embedding of Knowledge for Reasoning	Dec 1, 2019	Logical ReasoningRelational Reasoning	CodeCode Available	1
Bridging Machine Learning and Logical Reasoning by Abductive Learning	Dec 1, 2019	BIG-bench Machine LearningLogical Reasoning	CodeCode Available	0
Neural Logic Networks	Oct 17, 2019	Collaborative FilteringLogical Reasoning	—Unverified	0

Show:10 25 50

← PrevPage 14 of 15Next →

All datasets LingOly BIG-bench (Formal Fallacies Syllogisms Negation)BIG-bench (Penguins In A Table)BIG-bench (Reasoning About Colored Objects)BIG-bench (Temporal Sequences)BIG-bench (Logic Grid Puzzle)BIG-bench (StrategyQA)RuWorldTree Winograd Automatic BIG-bench (Logical Fallacy Detection)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Claude Opus	Delta_NoContext	28.8	—	Unverified
2	GPT-4o	Delta_NoContext	25.1	—	Unverified
3	Gemini 1.5 Pro	Delta_NoContext	23.4	—	Unverified
4	GPT-4	Delta_NoContext	21.5	—	Unverified
5	Command R+	Delta_NoContext	11.6	—	Unverified
6	GPT-3.5	Delta_NoContext	11.2	—	Unverified
7	Mixtral 8x7B	Delta_NoContext	6.4	—	Unverified
8	Llama 3 8B	Delta_NoContext	4.9	—	Unverified
9	Llama 3 70B	Delta_NoContext	2.9	—	Unverified
10	Gemma 7B	Delta_NoContext	2.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, Direct)	Accuracy	64.8	—	Unverified
2	PaLM 2 (few-shot, k=3, CoT)	Accuracy	57.2	—	Unverified
3	OPT 66B (few-shot, k=3)	Accuracy	54	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	53.6	—	Unverified
5	GPT-NeoX 20B (few-shot, k=3)	Accuracy	52.8	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	52.8	—	Unverified
7	Chinchilla-70B (few-shot, k=5)	Accuracy	52.1	—	Unverified
8	Bloomberg GPT 50B (few-shot, k=3)	Accuracy	50.8	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	50.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	84.9	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	65.8	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	48.7	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	44.5	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	40.6	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	40.41	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	37.67	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	33.56	—	Unverified
9	OPT 66B (few-shot, k=3)	Accuracy	28.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	91.2	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	61.2	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	59.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	49.2	—	Unverified
5	PaLM 540B (few-shot, k=3)	Accuracy	38	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	34.8	—	Unverified
8	OPT 66B (few-shot, k=3)	Accuracy	31.2	—	Unverified
9	GPT-NeoX (few-shot, k=3)	Accuracy	26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	100	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	96.4	—	Unverified
3	PaLM 540B (few-shot, k=3)	Accuracy	39.6	—	Unverified
4	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
5	Chinchilla-70B (few-shot, k=5)	Accuracy	32	—	Unverified
6	Bloomberg GPT (few-shot, k=3)	Accuracy	29.2	—	Unverified
7	OPT 66B (few-shot, k=3)	Accuracy	23.6	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	21.2	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	44	—	Unverified
2	PaLM-540B (few-shot, k=5)	Accuracy	42.4	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	36.5	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	35.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	73.9	—	Unverified
2	Chinchilla-70B (few-shot, k=5)	Accuracy	68.3	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	65.4	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	83.7	—	Unverified
2	RuGPT-3 Large	Accuracy	40.7	—	Unverified
3	RuGPT-3 Medium	Accuracy	38	—	Unverified
4	RuGPT-3 Small	Accuracy	34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	87	—	Unverified
2	RuGPT-3 Small	Accuracy	57.9	—	Unverified
3	RuGPT-3 Medium	Accuracy	57.2	—	Unverified
4	RuGPT-3 Large	Accuracy	55.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	72.1	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	58.9	—	Unverified