Logical Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–747 of 747 papers

Title	Date	Tasks	Status
Neural Logic Networks	Oct 17, 2019	Collaborative FilteringLogical Reasoning	—Unverified
MMM: Multi-stage Multi-task Learning for Multi-choice Reading Comprehension	Oct 1, 2019	Logical ReasoningMachine Reading Comprehension	CodeCode Available
Graph Neural Reasoning May Fail in Certifying Boolean Unsatisfiability	Sep 25, 2019	Logical Reasoning	—Unverified
Graph Neural Networks for Reasoning 2-Quantified Boolean Formulas	Sep 25, 2019	Logical Reasoning	—Unverified
Non-monotonic Logical Reasoning Guiding Deep Learning for Explainable Visual Question Answering	Sep 23, 2019	Inductive LearningLogical Reasoning	—Unverified
Teaching Pretrained Models with Commonsense Reasoning: A Preliminary KB-Based Approach	Sep 20, 2019	Few-Shot LearningLogical Reasoning	—Unverified
Logic and the 2-Simplicial Transformer	Sep 2, 2019	Deep Reinforcement LearningInductive Bias	—Unverified
Towards a Theory of Intentions for Human-Robot Collaboration	Jul 31, 2019	Computational EfficiencyLogical Reasoning	—Unverified
Semantic RL with Action Grammars: Data-Efficient Learning of Hierarchical Task Abstractions	Jul 29, 2019	Hierarchical Reinforcement LearningLogical Reasoning	CodeCode Available
SATNet: Bridging deep learning and logical reasoning using a differentiable satisfiability solver	May 29, 2019	Deep LearningGame of Sudoku	CodeCode Available
Controlled Natural Languages and Default Reasoning	May 11, 2019	ImplicaturesLogical Reasoning	—Unverified
Declarative Question Answering over Knowledge Bases containing Natural Language Text with Answer Set Programming	May 1, 2019	Logical ReasoningNatural Language Inference	CodeCode Available
How to Make a BLT Sandwich? Learning to Reason towards Understanding Web Instructional Videos	Dec 2, 2018	Logical ReasoningQuestion Answering	—Unverified
Compositional Attention Networks for Interpretability in Natural Language Question Answering	Oct 30, 2018	Logical ReasoningQuestion Answering	—Unverified
Ontology Reasoning with Deep Neural Networks	Aug 24, 2018	Logical Reasoning	CodeCode Available
Argumentation Synthesis following Rhetorical Strategies	Aug 1, 2018	Argument MiningEthics	—Unverified
Modeling Human Decision-making: An Overview of the Brussels Quantum Approach	Jul 29, 2018	Decision MakingLogical Reasoning	—Unverified
Data Science with Vadalog: Bridging Machine Learning and Reasoning	Jul 23, 2018	BIG-bench Machine LearningKnowledge Graphs	—Unverified
Neural Tensor Networks with Diagonal Slice Matrices	Jun 1, 2018	Knowledge Graph CompletionLogical Reasoning	—Unverified
DeepLogic: Towards End-to-End Differentiable Logical Reasoning	May 18, 2018	BIG-bench Machine LearningLogical Reasoning	CodeCode Available
Consistent CCG Parsing over Multiple Sentences for Improved Logical Reasoning	Apr 19, 2018	Automated Theorem ProvingFormal Logic	—Unverified
First Experiments with a Flexible Infrastructure for Normative Reasoning	Apr 9, 2018	Logical Reasoning	—Unverified
A Dataset and Architecture for Visual Reasoning with a Working Memory	Mar 16, 2018	DiagnosticLogical Reasoning	CodeCode Available
GOTaxon: Representing the evolution of biological functions in the Gene Ontology	Feb 16, 2018	Logical Reasoning	CodeCode Available
A New Algorithmic Decision for Categorical Syllogisms via Caroll's Diagrams	Feb 8, 2018	Logical Reasoningvalid	—Unverified
A Theoretical Solution of the Mind-Body Problem: An Operationalized Proof that no Purely Physical System Can Exhibit all the Properties of Human Consciousness	Oct 31, 2017	AllLogical Reasoning	—Unverified
Is writing style predictive of scientific fraud?	Sep 1, 2017	Logical Reasoning	—Unverified
TensorLog: Deep Learning Meets Probabilistic DBs	Jul 17, 2017	Deep LearningLogical Reasoning	—Unverified
Is writing style predictive of scientific fraud?	Jul 13, 2017	Logical Reasoning	—Unverified
Towards Better Response Times and Higher-Quality Queries in Interactive Knowledge Base Debugging	Sep 8, 2016	Active LearningLogical Reasoning	—Unverified
Compositional Distributional Cognition	Aug 12, 2016	Logical Reasoning	—Unverified
Chains of Reasoning over Entities, Relations, and Text using Recurrent Neural Networks	Jul 5, 2016	Logical Reasoning	CodeCode Available
Neural Networks and Continuous Time	Jun 14, 2016	General ClassificationLogical Reasoning	—Unverified
Mapping Ontologies Using Ontologies: Cross-lingual Semantic Role Information Transfer	May 1, 2016	Logical Reasoning	—Unverified
Reasoning in Vector Space: An Exploratory Study of Question Answering	Nov 19, 2015	Common Sense ReasoningLogical Reasoning	—Unverified
Object-Oriented Dynamic Networks	Oct 14, 2015	Logical ReasoningObject	—Unverified
Mixed Logical and Probabilistic Reasoning for Planning and Explanation Generation in Robotics	Aug 1, 2015	Explanation GenerationLogical Reasoning	—Unverified
Towards Ideal Semantics for Analyzing Stream Reasoning	May 20, 2015	Logical Reasoning	—Unverified
A New Fundamental Evidence of Non-Classical Structure in the Combination of Natural Concepts	May 19, 2015	Logical Reasoning	—Unverified
The RatioLog Project: Rational Extensions of Logical Reasoning	Mar 20, 2015	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified
Quantum Structure of Negation and Conjunction in Human Thought	Mar 14, 2015	Logical ReasoningNegation	—Unverified
Quantum Structure in Cognition and the Foundations of Human Reasoning	Dec 30, 2014	Decision MakingLogical Reasoning	—Unverified
Inferring User Preferences by Probabilistic Logical Reasoning over Social Networks	Nov 11, 2014	AttributeLogical Reasoning	—Unverified
Learning Distributed Word Representations for Natural Logic Reasoning	Oct 15, 2014	Logical ReasoningOpen-Ended Question Answering	—Unverified
New Directions in Vector Space Models of Meaning	Jun 1, 2014	Document ClassificationLanguage Modelling	—Unverified
Can recursive neural tensor networks learn logical reasoning?	Dec 21, 2013	Logical ReasoningTensor Networks	CodeCode Available
Lp : A Logic for Statistical Information	Mar 27, 2013	Bayesian InferenceLogical Reasoning	—Unverified

Show:10 25 50

← PrevPage 15 of 15Next →

All datasets LingOly BIG-bench (Formal Fallacies Syllogisms Negation)BIG-bench (Penguins In A Table)BIG-bench (Reasoning About Colored Objects)BIG-bench (Temporal Sequences)BIG-bench (Logic Grid Puzzle)BIG-bench (StrategyQA)RuWorldTree Winograd Automatic BIG-bench (Logical Fallacy Detection)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Claude Opus	Delta_NoContext	28.8	—	Unverified
2	GPT-4o	Delta_NoContext	25.1	—	Unverified
3	Gemini 1.5 Pro	Delta_NoContext	23.4	—	Unverified
4	GPT-4	Delta_NoContext	21.5	—	Unverified
5	Command R+	Delta_NoContext	11.6	—	Unverified
6	GPT-3.5	Delta_NoContext	11.2	—	Unverified
7	Mixtral 8x7B	Delta_NoContext	6.4	—	Unverified
8	Llama 3 8B	Delta_NoContext	4.9	—	Unverified
9	Llama 3 70B	Delta_NoContext	2.9	—	Unverified
10	Gemma 7B	Delta_NoContext	2.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, Direct)	Accuracy	64.8	—	Unverified
2	PaLM 2 (few-shot, k=3, CoT)	Accuracy	57.2	—	Unverified
3	OPT 66B (few-shot, k=3)	Accuracy	54	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	53.6	—	Unverified
5	GPT-NeoX 20B (few-shot, k=3)	Accuracy	52.8	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	52.8	—	Unverified
7	Chinchilla-70B (few-shot, k=5)	Accuracy	52.1	—	Unverified
8	Bloomberg GPT 50B (few-shot, k=3)	Accuracy	50.8	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	50.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	84.9	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	65.8	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	48.7	—	Unverified
4	PaLM 540B (few-shot, k=3)	Accuracy	44.5	—	Unverified
5	Gopher-280B (few-shot, k=5)	Accuracy	40.6	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	40.41	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	37.67	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	33.56	—	Unverified
9	OPT 66B (few-shot, k=3)	Accuracy	28.08	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	91.2	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	61.2	—	Unverified
3	Chinchilla-70B (few-shot, k=5)	Accuracy	59.7	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	49.2	—	Unverified
5	PaLM 540B (few-shot, k=3)	Accuracy	38	—	Unverified
6	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
7	Bloomberg GPT (few-shot, k=3)	Accuracy	34.8	—	Unverified
8	OPT 66B (few-shot, k=3)	Accuracy	31.2	—	Unverified
9	GPT-NeoX (few-shot, k=3)	Accuracy	26	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM 2 (few-shot, k=3, CoT)	Accuracy	100	—	Unverified
2	PaLM 2 (few-shot, k=3, Direct)	Accuracy	96.4	—	Unverified
3	PaLM 540B (few-shot, k=3)	Accuracy	39.6	—	Unverified
4	BLOOM 176B (few-shot, k=3)	Accuracy	36.8	—	Unverified
5	Chinchilla-70B (few-shot, k=5)	Accuracy	32	—	Unverified
6	Bloomberg GPT (few-shot, k=3)	Accuracy	29.2	—	Unverified
7	OPT 66B (few-shot, k=3)	Accuracy	23.6	—	Unverified
8	GPT-NeoX (few-shot, k=3)	Accuracy	21.2	—	Unverified
9	Gopher-280B (few-shot, k=5)	Accuracy	19	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	44	—	Unverified
2	PaLM-540B (few-shot, k=5)	Accuracy	42.4	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	36.5	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	35.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	PaLM-540B (few-shot, k=5)	Accuracy	73.9	—	Unverified
2	Chinchilla-70B (few-shot, k=5)	Accuracy	68.3	—	Unverified
3	PaLM-62B (few-shot, k=5)	Accuracy	65.4	—	Unverified
4	Gopher-280B (few-shot, k=5)	Accuracy	61	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	83.7	—	Unverified
2	RuGPT-3 Large	Accuracy	40.7	—	Unverified
3	RuGPT-3 Medium	Accuracy	38	—	Unverified
4	RuGPT-3 Small	Accuracy	34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Human benchmark	Accuracy	87	—	Unverified
2	RuGPT-3 Small	Accuracy	57.9	—	Unverified
3	RuGPT-3 Medium	Accuracy	57.2	—	Unverified
4	RuGPT-3 Large	Accuracy	55.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Chinchilla-70B (few-shot, k=5)	Accuracy	72.1	—	Unverified
2	Gopher-280B (few-shot, k=5)	Accuracy	58.9	—	Unverified