DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Japanese Confidential Information Extraction SFT Dataset | DataSalon

Home NLP & TextJapanese Confidential Information Extraction SFT Dataset

NLP & Text

Japanese Confidential Information Extraction SFT Dataset

Name: Japanese Confidential Information Extraction SFT Dataset
Creator: akiFQC
Published: 2026-06-06T13:32:41
Keywords: Japanese Text, Named Entity Recognition, Text, Confidential Information, Supervised Fine Tuning

by akiFQC·Updated 26d ago

Available on 1 platform

Description

11 categories of confidential named entities are annotated for extraction from Japanese text. The dataset is designed for Supervised Fine-Tuning (SFT) of LFM2-family models, such as with LoRA, and was created by author akiFQC. It was last updated on 2026-06-06.

Use Cases

Fine-tune language models for named entity recognition based on the described 11 confidential entity categories.
Develop systems for redacting or classifying sensitive information from Japanese business documents.
Benchmark model performance on extracting specific entity types like email addresses and account identifiers from Japanese text.

Strengths

Defines a specific task of extracting 11 categories of confidential entities from Japanese text.
Designed for a concrete application: Supervised Fine-Tuning (SFT) of LFM2-family models.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Row count is unknown, which may limit suitability assessment.
Column-level documentation is absent; field semantics must be inferred after download.

Provenance

Source: huggingface
Freshness: Last updated 2026-06-06 23:48:28; freshness should be verified.

Text Japanese Text Named Entity Recognition Confidential Information Supervised Fine Tuning

Related Datasets

Quality Score

D38

Description

Source

Reputation

Quality Score

D38

Description

Source

Reputation

Access

Community

49 downloads

1 likes

0 views

Dataset Info

Author: akiFQC
Created: Jun 6, 2026
Updated: Jun 6, 2026
Last synced: Jun 29, 2026

Access

Community

49 downloads

1 likes

0 views

Dataset Info

Author: akiFQC
Created: Jun 6, 2026
Updated: Jun 6, 2026
Last synced: Jun 29, 2026

Japanese Confidential Information Extraction SFT Dataset

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info