Logical Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 747 papers

Title	Date	Tasks	Status	Hype
Reasoning Like Program Executors	Jan 27, 2022	Logical ReasoningMath	—Unverified	0
Combining Commonsense Reasoning and Knowledge Acquisition to Guide Deep Learning in Robotics	Jan 25, 2022	Decision MakingLogical Reasoning	—Unverified	0
BTPK-based interpretable method for NER tasks based on Talmudic Public Announcement Logic	Jan 24, 2022	Decision MakingLogical Reasoning	—Unverified	0
Scales and Hedges in a Logic with Analogous Semantics	Jan 21, 2022	Decision MakingLogical Reasoning	—Unverified	0
Emergent Symbols through Binding in External Memory	Jan 17, 2022	Logical Reasoning	—Unverified	0
FaiRR: Faithful and Robust Deductive Reasoning over Natural Language	Jan 16, 2022	Fact SelectionLogical Reasoning	—Unverified	0
Can BERT Conduct Logical Reasoning? On the Difficulty of Learning to Reason from Data	Jan 16, 2022	Logical Reasoning	—Unverified	0
MANGO: Enhancing the Robustness of VQA Models via Adversarial Noise Generation	Jan 16, 2022	Logical ReasoningQuestion Answering	—Unverified	0
Quantifying Adaptability in Pre-trained Language Models with 500 Tasks	Jan 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
Does Entity Abstraction Help Generative Transformers Reason?	Jan 5, 2022	Conversational Question AnsweringLogical Reasoning	—Unverified	0
Modeling Associative Reasoning Processes	Jan 3, 2022	Logical Reasoning	—Unverified	0
Explainability Is in the Mind of the Beholder: Establishing the Foundations of Explainable Artificial Intelligence	Dec 29, 2021	BIG-bench Machine LearningExplainable artificial intelligence	—Unverified	0
The theory of quantitative trading	Dec 27, 2021	ArticlesLogical Reasoning	—Unverified	0
Graph Collaborative Reasoning	Dec 27, 2021	Link PredictionLogical Reasoning	—Unverified	0
Scaling Language Models: Methods, Analysis & Insights from Training Gopher	Dec 8, 2021	Abstract AlgebraAnachronisms	CodeCode Available	2
Quantifying Adaptability in Pre-trained Language Models with 500 Tasks	Dec 6, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
LoNLI: An Extensible Framework for Testing Diverse Logical Reasoning Capabilities for NLI	Dec 4, 2021	Logical ReasoningNatural Language Inference	—Unverified	0
Scallop: From Probabilistic Deductive Databases to Scalable Differentiable Reasoning	Dec 1, 2021	Logical ReasoningQuestion Answering	—Unverified	0
Two-stage Rule-induction Visual Reasoning on RPMs with an Application to Video Prediction	Nov 24, 2021	Logical ReasoningVideo Prediction	—Unverified	0
Enhancing Multilingual Language Model with Massive Multilingual Knowledge Triples	Nov 22, 2021	Knowledge GraphsLanguage Modeling	CodeCode Available	1
What Makes Machine Reading Comprehension Questions Difficult? Investigating Variation in Passage Sources and Question Types	Nov 16, 2021	Logical ReasoningMachine Reading Comprehension	—Unverified	0
Table-based Fact Verification with Self-adaptive Mixture of Experts	Nov 16, 2021	Fact VerificationLogical Reasoning	—Unverified	0
Reasoning Like Program Executors	Nov 16, 2021	Logical ReasoningMath	—Unverified	0
Logic-Driven Context Extension and Data Augmentation for Logical Reasoning of Text	Nov 16, 2021	Contrastive LearningData Augmentation	—Unverified	0
CausalR: Causal Reasoning over Natural Language Rulebases	Nov 16, 2021	Fact SelectionLogical Reasoning	—Unverified	0
AbductionRules: Training Transformers to Explain Unexpected Inputs	Nov 16, 2021	Common Sense ReasoningLogical Reasoning	—Unverified	0
Automated scholarly paper review: Concepts, technologies, and challenges	Nov 15, 2021	Logical Reasoning	—Unverified	0
Diagnosing the First-Order Logical Reasoning Ability Through LogicNLI	Nov 1, 2021	DiagnosticLogical Reasoning	—Unverified	0
SQALER: Scaling Question Answering by Decoupling Multi-Hop and Logical Reasoning	Oct 27, 2021	Knowledge GraphsLogical Reasoning	—Unverified	0
Probabilistic Entity Representation Model for Reasoning over Knowledge Graphs	Oct 26, 2021	Knowledge Graph EmbeddingKnowledge Graphs	CodeCode Available	1
Logical Assessment Formula and Its Principles for Evaluations with Inaccurate Ground-Truth Labels	Oct 22, 2021	Logical Reasoning	—Unverified	0
One-Step Abductive Multi-Target Learning with Diverse Noisy Samples and Its Application to Tumour Segmentation for Breast Cancer	Oct 20, 2021	BIG-bench Machine LearningLogical Reasoning	CodeCode Available	0
A Survey on State-of-the-art Techniques for Knowledge Graphs Construction and Challenges ahead	Oct 15, 2021	Knowledge GraphsLogical Reasoning	—Unverified	0
ConditionalQA: A Complex Reading Comprehension Dataset with Conditional Answers	Oct 13, 2021	Logical ReasoningQuestion Answering	CodeCode Available	1
A Survey of Knowledge Enhanced Pre-trained Models	Oct 1, 2021	Logical ReasoningRepresentation Learning	—Unverified	0
Truth Table Deep Convolutional Neural Network, A New SAT-Encodable Architecture - Application To Complete Robustness	Sep 29, 2021	Explainable Artificial Intelligence (XAI)Explanation Generation	—Unverified	0
Logic Pre-Training of Language Models	Sep 29, 2021	Logical ReasoningMachine Reading Comprehension	—Unverified	0
NAIL: A Challenging Benchmark for Na\"ive Logical Reasoning	Sep 29, 2021	Logical Reasoning	—Unverified	0
Efficient Training and Inference of Hypergraph Reasoning Networks	Sep 29, 2021	Knowledge GraphsLogical Reasoning	—Unverified	0
Weakly Supervised Explainable Phrasal Reasoning with Neural Fuzzy Logic	Sep 18, 2021	Explanation GenerationLogical Reasoning	CodeCode Available	0
What Makes Reading Comprehension Questions Difficult? Investigating Variation in Passage Sources and Question Types	Sep 17, 2021	Logical ReasoningMultiple-choice	—Unverified	0
Counterfactual Adversarial Learning with Representation Interpolation	Sep 10, 2021	counterfactualLogical Reasoning	CodeCode Available	0
AI Descartes: Combining Data and Theory for Derivable Scientific Discovery	Sep 3, 2021	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available	1
Sinoledge: A Knowledge Engine based on Logical Reasoning and Distributed Micro Services	Aug 29, 2021	Logical Reasoning	—Unverified	0
From Statistical Relational to Neurosymbolic Artificial Intelligence: a Survey	Aug 25, 2021	Logical ReasoningSurvey	—Unverified	0
Exploring Generalization Ability of Pretrained Language Models on Arithmetic and Logical Reasoning	Aug 15, 2021	Logical Reasoning	—Unverified	0
From LSAT: The Progress and Challenges of Complex Reasoning	Aug 2, 2021	Few-Shot LearningLogical Reasoning	CodeCode Available	1
Knowledge Informed Semantic Parsing for Conversational Question Answering	Aug 1, 2021	Conversational Question AnsweringDecoder	—Unverified	0
Improving Coherence and Consistency in Neural Sequence Models with Dual-System, Neuro-Symbolic Reasoning	Jul 6, 2021	Instruction FollowingLogical Reasoning	—Unverified	0
Reasoning with Transformer-based Models: Deep Learning, but Shallow Reasoning	Jun 22, 2021	Deep LearningLogical Reasoning	CodeCode Available	0

Show:10 25 50

← PrevPage 13 of 15Next →

All datasets LingOly BIG-bench (Formal Fallacies Syllogisms Negation)BIG-bench (Penguins In A Table)BIG-bench (Reasoning About Colored Objects)BIG-bench (Temporal Sequences)BIG-bench (Logic Grid Puzzle)BIG-bench (StrategyQA)RuWorldTree Winograd Automatic BIG-bench (Logical Fallacy Detection)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Claude Opus	Delta_NoContext	28.8	—	Unverified
2	GPT-4o	Delta_NoContext	25.1	—	Unverified
3	Gemini 1.5 Pro	Delta_NoContext	23.4	—	Unverified
4	GPT-4	Delta_NoContext	21.5	—	Unverified
5	Command R+	Delta_NoContext	11.6	—	Unverified
6	GPT-3.5	Delta_NoContext	11.2	—	Unverified
7	Mixtral 8x7B	Delta_NoContext	6.4	—	Unverified
8	Llama 3 8B	Delta_NoContext	4.9	—	Unverified
9	Llama 3 70B	Delta_NoContext	2.9	—	Unverified
10	Gemma 7B	Delta_NoContext	2.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, Direct)	Accuracy	64.8	—	Unverified
2	PaLM 2 (few-shot, k=3, CoT)	Accuracy	57.2	—	Unverified
3	OPT 66B (few-shot, k=3)	Accuracy	54	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	53.6	—	Unverified
5	GPT-NeoX 20B (few-shot, k=3)	Accuracy	52.8	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	52.8	—	Unverified
7	Chinchilla-70B (few-shot, k=5)	Accuracy	52.1	—	Unverified
8	Bloomberg GPT 50B (few-shot, k=3)	Accuracy	50.8	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	50.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	84.9	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	65.8	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	48.7	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	44.5	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	40.6	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	40.41	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	37.67	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	33.56	—	Unverified
9	OPT 66B (few-shot, k=3)	Accuracy	28.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	91.2	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	61.2	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	59.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	49.2	—	Unverified
5	PaLM 540B (few-shot, k=3)	Accuracy	38	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	34.8	—	Unverified
8	OPT 66B (few-shot, k=3)	Accuracy	31.2	—	Unverified
9	GPT-NeoX (few-shot, k=3)	Accuracy	26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	100	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	96.4	—	Unverified
3	PaLM 540B (few-shot, k=3)	Accuracy	39.6	—	Unverified
4	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
5	Chinchilla-70B (few-shot, k=5)	Accuracy	32	—	Unverified
6	Bloomberg GPT (few-shot, k=3)	Accuracy	29.2	—	Unverified
7	OPT 66B (few-shot, k=3)	Accuracy	23.6	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	21.2	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	44	—	Unverified
2	PaLM-540B (few-shot, k=5)	Accuracy	42.4	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	36.5	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	35.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	73.9	—	Unverified
2	Chinchilla-70B (few-shot, k=5)	Accuracy	68.3	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	65.4	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	83.7	—	Unverified
2	RuGPT-3 Large	Accuracy	40.7	—	Unverified
3	RuGPT-3 Medium	Accuracy	38	—	Unverified
4	RuGPT-3 Small	Accuracy	34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	87	—	Unverified
2	RuGPT-3 Small	Accuracy	57.9	—	Unverified
3	RuGPT-3 Medium	Accuracy	57.2	—	Unverified
4	RuGPT-3 Large	Accuracy	55.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	72.1	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	58.9	—	Unverified