Legal Reasoning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–92 of 92 papers

Title	Date	Tasks	Status
Modelling Value-oriented Legal Reasoning in LogiKEy	Jun 23, 2020	Automated Theorem ProvingLegal Reasoning	—Unverified
Engineering the Law-Machine Learning Translation Problem: Developing Legally Aligned Models	Apr 23, 2025	Legal Reasoning	—Unverified
Enhancing Logical Reasoning in Large Language Models to Facilitate Legal Applications	Nov 22, 2023	FairnessLegal Reasoning	—Unverified
Evaluating Test-Time Scaling LLMs for Legal Reasoning: OpenAI o1, DeepSeek-R1, and Beyond	Mar 20, 2025	Legal Reasoning	—Unverified
Explainable machine learning multi-label classification of Spanish legal judgements	May 27, 2024	ClassificationJurisprudence	—Unverified
Exploiting Domain-Specific Knowledge for Judgment Prediction Is No Panacea	Sep 1, 2021	ArticlesLegal Reasoning	—Unverified
Exploring the psychology of LLMs' Moral and Legal Reasoning	Aug 2, 2023	Legal Reasoning	—Unverified
Formalising Anti-Discrimination Law in Automated Decision Systems	Jun 29, 2024	FairnessLegal Reasoning	—Unverified
IndianBailJudgments-1200: A Multi-Attribute Dataset for Legal NLP on Indian Bail Orders	Jul 3, 2025	AttributeFairness	—Unverified
KFinEval-Pilot: A Comprehensive Benchmark Suite for Korean Financial Language Understanding	Apr 17, 2025	DiagnosticLegal Reasoning	—Unverified
KRAG Framework for Enhancing LLMs in the Legal Domain	Oct 10, 2024	Legal ReasoningNatural Language Understanding	—Unverified
LAPIS: Language Model-Augmented Police Investigation System	Jul 19, 2024	Language ModelingLanguage Modelling	—Unverified
LAR-ECHR: A New Legal Argument Reasoning Task and Dataset for Cases of the European Court of Human Rights	Oct 17, 2024	Legal ReasoningMultiple-choice	—Unverified
Large Language Models Acing Chartered Accountancy	Jun 26, 2025	Legal ReasoningRetrieval-augmented Generation	—Unverified
Large Language Models in Cryptocurrency Securities Cases: Can a GPT Model Meaningfully Assist Lawyers?	Aug 11, 2023	Decision MakingLegal Reasoning	—Unverified
Law Informs Code: A Legal Informatics Approach to Aligning Artificial Intelligence with Humans	Sep 14, 2022	Legal ReasoningPhilosophy	—Unverified
Law to Binary Tree -- An Formal Interpretation of Legal Natural Language	Dec 16, 2022	Decision MakingLegal Reasoning	—Unverified
LegalBench: A Collaboratively Built Benchmark for Measuring Legal Reasoning in Large Language Models	Aug 20, 2023	Legal Reasoning	—Unverified
LegalBench: Prototyping a Collaborative Benchmark for Legal Reasoning	Sep 13, 2022	Legal Reasoning	—Unverified
An Argumentation-Based Legal Reasoning Approach for DL-Ontology	Sep 7, 2022	Autonomous VehiclesLegal Reasoning	—Unverified
Legal Evalutions and Challenges of Large Language Models	Nov 15, 2024	Legal Reasoning	—Unverified
Designing Normative Theories for Ethical and Legal Reasoning: LogiKEy Framework, Methodology, and Tool Support	Mar 25, 2019	Legal Reasoning	CodeCode Available
Developing a Pragmatic Benchmark for Assessing Korean Legal Language Understanding in Large Language Models	Oct 11, 2024	Legal ReasoningRAG	CodeCode Available
Claim Extraction and Law Matching for COVID-19-related Legislation	Jun 1, 2022	ArticlesLegal Reasoning	CodeCode Available
Passing the Brazilian OAB Exam: data preparation and some experiments	Dec 14, 2017	Legal Reasoning	CodeCode Available
ECtHR-PCR: A Dataset for Precedent Understanding and Prior Case Retrieval in the European Court of Human Rights	Mar 31, 2024	Legal ReasoningRetrieval	CodeCode Available
Elevating Legal LLM Responses: Harnessing Trainable Logical Structures and Semantic Knowledge with Legal Reasoning	Feb 11, 2025	HallucinationIn-Context Learning	CodeCode Available
Weak-to-Strong Generalization beyond Accuracy: a Pilot Study in Safety, Toxicity, and Legal Reasoning	Oct 16, 2024	Binary ClassificationLegal Reasoning	CodeCode Available
NitiBench: A Comprehensive Studies of LLM Frameworks Capabilities for Thai Legal Question Answering	Feb 15, 2025	ChunkingInformation Retrieval	CodeCode Available
TMID: A Comprehensive Real-world Dataset for Trademark Infringement Detection in E-Commerce	Dec 8, 2023	Legal Reasoning	CodeCode Available
LegiLM: A Fine-Tuned Legal Language Model for Data Compliance	Sep 9, 2024	Information RetrievalLanguage Modeling	CodeCode Available
Software Engineering Methods For AI-Driven Deductive Legal Reasoning	Apr 15, 2024	Formal LogicLegal Reasoning	CodeCode Available
LeKUBE: A Legal Knowledge Update BEnchmark	Jul 19, 2024	Legal Reasoning	CodeCode Available
One Law, Many Languages: Benchmarking Multilingual Legal Reasoning for Judicial Support	Jun 15, 2023	BenchmarkingInformation Retrieval	CodeCode Available
Causality and Responsibility for Formal Verification and Beyond	Aug 29, 2016	Legal Reasoning	CodeCode Available
LLM-based HSE Compliance Assessment: Benchmark, Performance, and Advancements	May 29, 2025	Legal Reasoning	CodeCode Available
Can Large Language Models Grasp Legal Theories? Enhance Legal Reasoning with Insights from Multi-Agent Collaboration	Oct 3, 2024	Legal Reasoning	CodeCode Available
Incorporating Legal Structure in Retrieval-Augmented Generation: A Case Study on Copyright Fair Use	May 4, 2025	Knowledge GraphsLegal Reasoning	CodeCode Available
Parameter Efficient Fine Tuning Llama 3.1 for Answering Arabic Legal Questions: A Case Study on Jordanian Laws	Jun 2, 2025	Language ModelingLanguage Modelling	CodeCode Available
Investigating the Shortcomings of LLMs in Step-by-Step Legal Reasoning	Feb 8, 2025	Legal ReasoningMultiple-choice	CodeCode Available
Can ChatGPT Perform Reasoning Using the IRAC Method in Analyzing Legal Scenarios Like a Lawyer?	Oct 23, 2023	Legal Reasoning	CodeCode Available
Modeling Legal Reasoning: LM Annotation at the Edge of Human Agreement	Oct 27, 2023	JurisprudenceLegal Reasoning	CodeCode Available

Show:10 25 50

← PrevPage 2 of 2Next →

All datasets LegalBench (Issue-spotting)LegalBench (Rule-recall)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	Balanced Accuracy	82.9	—	Unverified
2	GPT-3.5	Balanced Accuracy	60.9	—	Unverified
3	Claude-1	Balanced Accuracy	58.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4	Balanced Accuracy	59.2	—	Unverified