DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

CAIL2018: Chinese AI Law Challenge 2018 Dataset | DataSalon

Home Government & LegalCAIL2018: Chinese AI Law Challenge 2018 Dataset

Government & Legal

CAIL2018: Chinese AI Law Challenge 2018 Dataset

Name: CAIL2018: Chinese AI Law Challenge 2018 Dataset
Creator: china-ai-law-challenge
Published: 2022-03-02T23:29:22
Keywords: Source Datasetsoriginal, Judgement Prediction, Librarypolars, Languagezh, Librarydask, Size Categories1 Mn10 M, Licenseunknown, Language Creatorsfound, Modalitytext, Modalitytabular, Librarymlcroissant, Librarydatasets, Parquet, Annotations Creatorsfound, Task Categoriesother, Regionus, Multilingualitymonolingual, Arxiv180702478

by china-ai-law-challenge·Updated 2y ago

Available on 1 platform

Description

2,676,075 Chinese criminal law documents categorized by law articles, charges, and sentencing terms. The dataset provides textual case descriptions paired with structured metadata for legal judgment prediction tasks.

Use Cases

Train a multi-label classification model to predict criminal charges using the 'fact' text and 'accusation' labels
Develop a regression model to estimate the length of a sentence using the 'term_of_imprisonment' field
Build an information retrieval system to identify 'relevant_articles' based on natural language case descriptions

Strengths

2,676,075 criminal law documents sourced from the Supreme People's Court of China
Labels for 183 distinct law articles and 202 different criminal charges
Includes a 'fact' column containing detailed textual descriptions of case circumstances
Provides 'term_of_imprisonment' data for regression-based sentencing prediction

Parquet Source Datasetsoriginal Judgement Prediction Librarypolars Languagezh Librarydask Size Categories1 Mn10 M Licenseunknown Language Creatorsfound Modalitytext Modalitytabular Librarymlcroissant Librarydatasets Annotations Creatorsfound Task Categoriesother Regionus Multilingualitymonolingual Arxiv180702478

Related Datasets

Quality Score

D34

Description

Source

Reputation

Quality Score

D34

Description

Source

Reputation

Access

Community

570 downloads

28 likes

0 views

Dataset Info

Author: china-ai-law-challenge
Created: Mar 2, 2022
Updated: Jan 16, 2024
Last synced: Jul 3, 2026

Access

Community

570 downloads

28 likes

0 views

Dataset Info

Author: china-ai-law-challenge
Created: Mar 2, 2022
Updated: Jan 16, 2024
Last synced: Jul 3, 2026

CAIL2018: Chinese AI Law Challenge 2018 Dataset

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info