Logical Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 747 papers

Title	Date	Tasks	Status
Reduced Implication-bias Logic Loss for Neuro-Symbolic Learning	Aug 14, 2022	Logical Reasoning	—Unverified
Language models show human-like content effects on reasoning tasks	Jul 14, 2022	Language ModellingLogical Reasoning	CodeCode Available
Emotion Recognition in Conversation using Probabilistic Soft Logic	Jul 14, 2022	Emotion RecognitionEmotion Recognition in Conversation	—Unverified
Discourse-Aware Graph Networks for Textual Logical Reasoning	Jul 4, 2022	graph constructionLogical Reasoning	—Unverified
AnaLog: Testing Analytical and Deductive Logic Learnability in Language Models	Jul 1, 2022	Language ModelingLanguage Modelling	—Unverified
Learning Symmetric Rules with SATNet	Jun 28, 2022	Logical ReasoningRubik's Cube	CodeCode Available
Towards Unifying Perceptual Reasoning and Logical Reasoning	Jun 27, 2022	Bayesian InferenceLogical Reasoning	—Unverified
TAR: Neural Logical Reasoning across TBox and ABox	May 29, 2022	DescriptiveLogical Reasoning	—Unverified
Reasoning over Logically Interacted Conditions for Question Answering	May 25, 2022	Logical ReasoningQuestion Answering	—Unverified
RobustLR: Evaluating Robustness to Logical Perturbation in Deductive Reasoning	May 25, 2022	Logical ReasoningNegation	CodeCode Available
FLEX: Feature-Logic Embedding Framework for CompleX Knowledge Graph Reasoning	May 23, 2022	Logical ReasoningNegation	CodeCode Available
Logical Reasoning with Span-Level Predictions for Interpretable and Robust NLI Models	May 23, 2022	Logical ReasoningNatural Language Inference	CodeCode Available
Selection-Inference: Exploiting Large Language Models for Interpretable Logical Reasoning	May 19, 2022	Logical Reasoning	—Unverified
LogiGAN: Learning Logical Reasoning via Adversarial Pre-training	May 18, 2022	Logical ReasoningSentence	—Unverified
Graph Neural Networks for Propositional Model Counting	May 9, 2022	Logical Reasoningmodel	—Unverified
Table-based Fact Verification with Self-adaptive Mixture of Experts	Apr 19, 2022	Fact VerificationLogical Reasoning	CodeCode Available
Reasoning with Multi-Structure Commonsense Knowledge in Visual Dialog	Apr 10, 2022	Logical ReasoningSentence	—Unverified
Enhancing Neural Mathematical Reasoning by Abductive Combination with Symbolic Library	Mar 28, 2022	Logical ReasoningMathematical Reasoning	—Unverified
A Densely Connected Criss-Cross Attention Network for Document-level Relation Extraction	Mar 26, 2022	Document-level Relation ExtractionLogical Reasoning	—Unverified
A Neural-Symbolic Approach to Natural Language Understanding	Mar 20, 2022	Logical ReasoningNatural Language Inference	CodeCode Available
What Makes Reading Comprehension Questions Difficult?	Mar 12, 2022	Logical ReasoningMultiple-choice	CodeCode Available
Towards Unifying Logical Entailment and Statistical Estimation	Feb 27, 2022	Formal LogicLogical Reasoning	—Unverified
MUC-driven Feature Importance Measurement and Adversarial Analysis for Random Forest	Feb 25, 2022	Feature ImportanceLogical Reasoning	—Unverified
JAMES: Normalizing Job Titles with Multi-Aspect Graph Embeddings and Reasoning	Feb 22, 2022	Logical ReasoningSemantic Similarity	—Unverified
Logical Reasoning for Task Oriented Dialogue Systems	Feb 8, 2022	Logical ReasoningNegation	—Unverified
Neural Logic Analogy Learning	Feb 4, 2022	Logical Reasoning	—Unverified
Reasoning Like Program Executors	Jan 27, 2022	Logical ReasoningMath	—Unverified
Combining Commonsense Reasoning and Knowledge Acquisition to Guide Deep Learning in Robotics	Jan 25, 2022	Decision MakingLogical Reasoning	—Unverified
BTPK-based interpretable method for NER tasks based on Talmudic Public Announcement Logic	Jan 24, 2022	Decision MakingLogical Reasoning	—Unverified
Scales and Hedges in a Logic with Analogous Semantics	Jan 21, 2022	Decision MakingLogical Reasoning	—Unverified
Emergent Symbols through Binding in External Memory	Jan 17, 2022	Logical Reasoning	—Unverified
Quantifying Adaptability in Pre-trained Language Models with 500 Tasks	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified
MANGO: Enhancing the Robustness of VQA Models via Adversarial Noise Generation	Jan 16, 2022	Logical ReasoningQuestion Answering	—Unverified
Can BERT Conduct Logical Reasoning? On the Difficulty of Learning to Reason from Data	Jan 16, 2022	Logical Reasoning	—Unverified
FaiRR: Faithful and Robust Deductive Reasoning over Natural Language	Jan 16, 2022	Fact SelectionLogical Reasoning	—Unverified
Does Entity Abstraction Help Generative Transformers Reason?	Jan 5, 2022	Conversational Question AnsweringLogical Reasoning	—Unverified
Modeling Associative Reasoning Processes	Jan 3, 2022	Logical Reasoning	—Unverified
Explainability Is in the Mind of the Beholder: Establishing the Foundations of Explainable Artificial Intelligence	Dec 29, 2021	BIG-bench Machine LearningExplainable artificial intelligence	—Unverified
Graph Collaborative Reasoning	Dec 27, 2021	Link PredictionLogical Reasoning	—Unverified
The theory of quantitative trading	Dec 27, 2021	ArticlesLogical Reasoning	—Unverified
LoNLI: An Extensible Framework for Testing Diverse Logical Reasoning Capabilities for NLI	Dec 4, 2021	Logical ReasoningNatural Language Inference	—Unverified
Scallop: From Probabilistic Deductive Databases to Scalable Differentiable Reasoning	Dec 1, 2021	Logical ReasoningQuestion Answering	—Unverified
Two-stage Rule-induction Visual Reasoning on RPMs with an Application to Video Prediction	Nov 24, 2021	Logical ReasoningVideo Prediction	—Unverified
What Makes Machine Reading Comprehension Questions Difficult? Investigating Variation in Passage Sources and Question Types	Nov 16, 2021	Logical ReasoningMachine Reading Comprehension	—Unverified
CausalR: Causal Reasoning over Natural Language Rulebases	Nov 16, 2021	Fact SelectionLogical Reasoning	—Unverified
Table-based Fact Verification with Self-adaptive Mixture of Experts	Nov 16, 2021	Fact VerificationLogical Reasoning	—Unverified
AbductionRules: Training Transformers to Explain Unexpected Inputs	Nov 16, 2021	Common Sense ReasoningLogical Reasoning	—Unverified
Logic-Driven Context Extension and Data Augmentation for Logical Reasoning of Text	Nov 16, 2021	Contrastive LearningData Augmentation	—Unverified
Reasoning Like Program Executors	Nov 16, 2021	Logical ReasoningMath	—Unverified
Automated scholarly paper review: Concepts, technologies, and challenges	Nov 15, 2021	Logical Reasoning	—Unverified

Show:10 25 50

← PrevPage 13 of 15Next →

All datasets LingOly BIG-bench (Formal Fallacies Syllogisms Negation)BIG-bench (Penguins In A Table)BIG-bench (Reasoning About Colored Objects)BIG-bench (Temporal Sequences)BIG-bench (Logic Grid Puzzle)BIG-bench (StrategyQA)RuWorldTree Winograd Automatic BIG-bench (Logical Fallacy Detection)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Claude Opus	Delta_NoContext	28.8	—	Unverified
2	GPT-4o	Delta_NoContext	25.1	—	Unverified
3	Gemini 1.5 Pro	Delta_NoContext	23.4	—	Unverified
4	GPT-4	Delta_NoContext	21.5	—	Unverified
5	Command R+	Delta_NoContext	11.6	—	Unverified
6	GPT-3.5	Delta_NoContext	11.2	—	Unverified
7	Mixtral 8x7B	Delta_NoContext	6.4	—	Unverified
8	Llama 3 8B	Delta_NoContext	4.9	—	Unverified
9	Llama 3 70B	Delta_NoContext	2.9	—	Unverified
10	Gemma 7B	Delta_NoContext	2.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, Direct)	Accuracy	64.8	—	Unverified
2	PaLM 2 (few-shot, k=3, CoT)	Accuracy	57.2	—	Unverified
3	OPT 66B (few-shot, k=3)	Accuracy	54	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	53.6	—	Unverified
5	GPT-NeoX 20B (few-shot, k=3)	Accuracy	52.8	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	52.8	—	Unverified
7	Chinchilla-70B (few-shot, k=5)	Accuracy	52.1	—	Unverified
8	Bloomberg GPT 50B (few-shot, k=3)	Accuracy	50.8	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	50.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	84.9	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	65.8	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	48.7	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	44.5	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	40.6	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	40.41	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	37.67	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	33.56	—	Unverified
9	OPT 66B (few-shot, k=3)	Accuracy	28.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	91.2	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	61.2	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	59.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	49.2	—	Unverified
5	PaLM 540B (few-shot, k=3)	Accuracy	38	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	34.8	—	Unverified
8	OPT 66B (few-shot, k=3)	Accuracy	31.2	—	Unverified
9	GPT-NeoX (few-shot, k=3)	Accuracy	26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	100	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	96.4	—	Unverified
3	PaLM 540B (few-shot, k=3)	Accuracy	39.6	—	Unverified
4	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
5	Chinchilla-70B (few-shot, k=5)	Accuracy	32	—	Unverified
6	Bloomberg GPT (few-shot, k=3)	Accuracy	29.2	—	Unverified
7	OPT 66B (few-shot, k=3)	Accuracy	23.6	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	21.2	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	44	—	Unverified
2	PaLM-540B (few-shot, k=5)	Accuracy	42.4	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	36.5	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	35.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	73.9	—	Unverified
2	Chinchilla-70B (few-shot, k=5)	Accuracy	68.3	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	65.4	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	83.7	—	Unverified
2	RuGPT-3 Large	Accuracy	40.7	—	Unverified
3	RuGPT-3 Medium	Accuracy	38	—	Unverified
4	RuGPT-3 Small	Accuracy	34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	87	—	Unverified
2	RuGPT-3 Small	Accuracy	57.9	—	Unverified
3	RuGPT-3 Medium	Accuracy	57.2	—	Unverified
4	RuGPT-3 Large	Accuracy	55.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	72.1	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	58.9	—	Unverified