Logical Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 747 papers

Title	Date	Tasks	Status	Hype
Type-dependent Prompt CycleQAG : Cycle Consistency for Multi-hop Question Generation	Oct 1, 2022	Answer GenerationLogical Reasoning	—Unverified	0
Dynamic Prompt Learning via Policy Gradient for Semi-structured Mathematical Reasoning	Sep 29, 2022	Logical ReasoningMath	CodeCode Available	1
Neural Methods for Logical Reasoning Over Knowledge Graphs	Sep 28, 2022	BenchmarkingKnowledge Graphs	CodeCode Available	1
Towards Human-Compatible XAI: Explaining Data Differentials with Concept Induction over Background Knowledge	Sep 27, 2022	Explainable Artificial Intelligence (XAI)Logical Reasoning	—Unverified	0
FOLIO: Natural Language Reasoning with First-Order Logic	Sep 2, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Time-aware Self-Attention Meets Logic Reasoning in Recommender Systems	Aug 29, 2022	Logical ReasoningRecommendation Systems	—Unverified	0
Knowledge-based and Data-driven Reasoning and Learning for Ad Hoc Teamwork	Aug 24, 2022	Decision MakingIncremental Learning	—Unverified	0
A Scalable, Interpretable, Verifiable & Differentiable Logic Gate Convolutional Neural Network Architecture From Truth Tables	Aug 18, 2022	FairnessLogical Reasoning	—Unverified	0
Reduced Implication-bias Logic Loss for Neuro-Symbolic Learning	Aug 14, 2022	Logical Reasoning	—Unverified	0
Emotion Recognition in Conversation using Probabilistic Soft Logic	Jul 14, 2022	Emotion RecognitionEmotion Recognition in Conversation	—Unverified	0
Language models show human-like content effects on reasoning tasks	Jul 14, 2022	Language ModellingLogical Reasoning	CodeCode Available	0
Discourse-Aware Graph Networks for Textual Logical Reasoning	Jul 4, 2022	graph constructionLogical Reasoning	—Unverified	0
AnaLog: Testing Analytical and Deductive Logic Learnability in Language Models	Jul 1, 2022	Language ModelingLanguage Modelling	—Unverified	0
Learning Symmetric Rules with SATNet	Jun 28, 2022	Logical ReasoningRubik's Cube	CodeCode Available	0
Towards Unifying Perceptual Reasoning and Logical Reasoning	Jun 27, 2022	Bayesian InferenceLogical Reasoning	—Unverified	0
Semantic Probabilistic Layers for Neuro-Symbolic Learning	Jun 1, 2022	Hierarchical Multi-label ClassificationLogical Reasoning	CodeCode Available	1
TAR: Neural Logical Reasoning across TBox and ABox	May 29, 2022	DescriptiveLogical Reasoning	—Unverified	0
TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph	May 28, 2022	Knowledge GraphsLogical Reasoning	CodeCode Available	1
Reasoning over Logically Interacted Conditions for Question Answering	May 25, 2022	Logical ReasoningQuestion Answering	—Unverified	0
RobustLR: Evaluating Robustness to Logical Perturbation in Deductive Reasoning	May 25, 2022	Logical ReasoningNegation	CodeCode Available	0
Large Language Models are Zero-Shot Reasoners	May 24, 2022	Arithmetic ReasoningCommon Sense Reasoning	CodeCode Available	2
On the Paradox of Learning to Reason from Data	May 23, 2022	Logical Reasoning	CodeCode Available	1
Logical Reasoning with Span-Level Predictions for Interpretable and Robust NLI Models	May 23, 2022	Logical ReasoningNatural Language Inference	CodeCode Available	0
FLEX: Feature-Logic Embedding Framework for CompleX Knowledge Graph Reasoning	May 23, 2022	Logical ReasoningNegation	CodeCode Available	0
Selection-Inference: Exploiting Large Language Models for Interpretable Logical Reasoning	May 19, 2022	Logical Reasoning	—Unverified	0
LogiGAN: Learning Logical Reasoning via Adversarial Pre-training	May 18, 2022	Logical ReasoningSentence	—Unverified	0
Graph Neural Networks for Propositional Model Counting	May 9, 2022	Logical Reasoningmodel	—Unverified	0
Logiformer: A Two-Branch Graph Transformer Network for Interpretable Logical Reasoning	May 2, 2022	Logical ReasoningMachine Reading Comprehension	CodeCode Available	1
Table-based Fact Verification with Self-adaptive Mixture of Experts	Apr 19, 2022	Fact VerificationLogical Reasoning	CodeCode Available	0
Reasoning with Multi-Structure Commonsense Knowledge in Visual Dialog	Apr 10, 2022	Logical ReasoningSentence	—Unverified	0
PaLM: Scaling Language Modeling with Pathways	Apr 5, 2022	Auto DebuggingCode Generation	CodeCode Available	2
Training Compute-Optimal Large Language Models	Mar 29, 2022	AnachronismsAnalogical Similarity	CodeCode Available	6
Enhancing Neural Mathematical Reasoning by Abductive Combination with Symbolic Library	Mar 28, 2022	Logical ReasoningMathematical Reasoning	—Unverified	0
A Densely Connected Criss-Cross Attention Network for Document-level Relation Extraction	Mar 26, 2022	Document-level Relation ExtractionLogical Reasoning	—Unverified	0
AbductionRules: Training Transformers to Explain Unexpected Inputs	Mar 23, 2022	Common Sense ReasoningLogical Reasoning	CodeCode Available	1
A Neural-Symbolic Approach to Natural Language Understanding	Mar 20, 2022	Logical ReasoningNatural Language Inference	CodeCode Available	0
ChartQA: A Benchmark for Question Answering about Charts with Visual and Logical Reasoning	Mar 19, 2022	Chart Question AnsweringLogical Reasoning	CodeCode Available	2
FaiRR: Faithful and Robust Deductive Reasoning over Natural Language	Mar 19, 2022	Fact SelectionLogical Reasoning	CodeCode Available	1
AdaLoGN: Adaptive Logic Graph Network for Reasoning-Based Machine Reading Comprehension	Mar 16, 2022	Logical ReasoningMachine Reading Comprehension	CodeCode Available	1
What Makes Reading Comprehension Questions Difficult?	Mar 12, 2022	Logical ReasoningMultiple-choice	CodeCode Available	0
A Neuro-vector-symbolic Architecture for Solving Raven's Progressive Matrices	Mar 9, 2022	Logical Reasoning	CodeCode Available	1
MERIt: Meta-Path Guided Contrastive Learning for Logical Reasoning	Mar 1, 2022	Contrastive Learningcounterfactual	CodeCode Available	1
Towards Unifying Logical Entailment and Statistical Estimation	Feb 27, 2022	Formal LogicLogical Reasoning	—Unverified	0
MUC-driven Feature Importance Measurement and Adversarial Analysis for Random Forest	Feb 25, 2022	Feature ImportanceLogical Reasoning	—Unverified	0
JAMES: Normalizing Job Titles with Multi-Aspect Graph Embeddings and Reasoning	Feb 22, 2022	Logical ReasoningSemantic Similarity	—Unverified	0
ExAIS: Executable AI Semantics	Feb 20, 2022	Logical Reasoningvalid	CodeCode Available	1
End-to-end Algorithm Synthesis with Recurrent Networks: Logical Extrapolation Without Overthinking	Feb 11, 2022	Logical Reasoning	CodeCode Available	1
Logical Reasoning for Task Oriented Dialogue Systems	Feb 8, 2022	Logical ReasoningNegation	—Unverified	0
VAEL: Bridging Variational Autoencoders and Probabilistic Logic Programming	Feb 7, 2022	Logical Reasoning	CodeCode Available	1
Neural Logic Analogy Learning	Feb 4, 2022	Logical Reasoning	—Unverified	0

Show:10 25 50

← PrevPage 12 of 15Next →

All datasets LingOly BIG-bench (Formal Fallacies Syllogisms Negation)BIG-bench (Penguins In A Table)BIG-bench (Reasoning About Colored Objects)BIG-bench (Temporal Sequences)BIG-bench (Logic Grid Puzzle)BIG-bench (StrategyQA)RuWorldTree Winograd Automatic BIG-bench (Logical Fallacy Detection)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Claude Opus	Delta_NoContext	28.8	—	Unverified
2	GPT-4o	Delta_NoContext	25.1	—	Unverified
3	Gemini 1.5 Pro	Delta_NoContext	23.4	—	Unverified
4	GPT-4	Delta_NoContext	21.5	—	Unverified
5	Command R+	Delta_NoContext	11.6	—	Unverified
6	GPT-3.5	Delta_NoContext	11.2	—	Unverified
7	Mixtral 8x7B	Delta_NoContext	6.4	—	Unverified
8	Llama 3 8B	Delta_NoContext	4.9	—	Unverified
9	Llama 3 70B	Delta_NoContext	2.9	—	Unverified
10	Gemma 7B	Delta_NoContext	2.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, Direct)	Accuracy	64.8	—	Unverified
2	PaLM 2 (few-shot, k=3, CoT)	Accuracy	57.2	—	Unverified
3	OPT 66B (few-shot, k=3)	Accuracy	54	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	53.6	—	Unverified
5	GPT-NeoX 20B (few-shot, k=3)	Accuracy	52.8	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	52.8	—	Unverified
7	Chinchilla-70B (few-shot, k=5)	Accuracy	52.1	—	Unverified
8	Bloomberg GPT 50B (few-shot, k=3)	Accuracy	50.8	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	50.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	84.9	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	65.8	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	48.7	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	44.5	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	40.6	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	40.41	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	37.67	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	33.56	—	Unverified
9	OPT 66B (few-shot, k=3)	Accuracy	28.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	91.2	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	61.2	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	59.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	49.2	—	Unverified
5	PaLM 540B (few-shot, k=3)	Accuracy	38	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	34.8	—	Unverified
8	OPT 66B (few-shot, k=3)	Accuracy	31.2	—	Unverified
9	GPT-NeoX (few-shot, k=3)	Accuracy	26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	100	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	96.4	—	Unverified
3	PaLM 540B (few-shot, k=3)	Accuracy	39.6	—	Unverified
4	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
5	Chinchilla-70B (few-shot, k=5)	Accuracy	32	—	Unverified
6	Bloomberg GPT (few-shot, k=3)	Accuracy	29.2	—	Unverified
7	OPT 66B (few-shot, k=3)	Accuracy	23.6	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	21.2	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	44	—	Unverified
2	PaLM-540B (few-shot, k=5)	Accuracy	42.4	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	36.5	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	35.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	73.9	—	Unverified
2	Chinchilla-70B (few-shot, k=5)	Accuracy	68.3	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	65.4	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	83.7	—	Unverified
2	RuGPT-3 Large	Accuracy	40.7	—	Unverified
3	RuGPT-3 Medium	Accuracy	38	—	Unverified
4	RuGPT-3 Small	Accuracy	34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	87	—	Unverified
2	RuGPT-3 Small	Accuracy	57.9	—	Unverified
3	RuGPT-3 Medium	Accuracy	57.2	—	Unverified
4	RuGPT-3 Large	Accuracy	55.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	72.1	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	58.9	—	Unverified