DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

NPSC: Norwegian Parliament Speech Corpus (Test Set) | DataSalon

Home Speech & AudioNPSC: Norwegian Parliament Speech Corpus (Test Set)

Speech & Audio

NPSC: Norwegian Parliament Speech Corpus (Test Set)

Name: NPSC: Norwegian Parliament Speech Corpus (Test Set)
Creator: NbAiLab
Published: 2022-03-02T23:29:22
Keywords: Source Datasetsoriginal, AUDIOFOLDER, Modalityaudio, Language Creatorsfound, Licensecc0 10, Languageno, Size Categoriesn1 K, Annotations Creatorsno Annotation, Librarymlcroissant, Task Categoriesaudio Classification, Librarydatasets, Languagenn, Regionus, Speech Modeling, Task Categoriesautomatic Speech Recognition, Multilingualitymonolingual, Languagenb

by NbAiLab·Updated 3y ago

Available on 1 platform

Description

Audio recordings and orthographic transcriptions from the Norwegian Parliament categorized into Norwegian Bokmål and Norwegian Nynorsk written standards. The corpus serves as a benchmark for Norwegian Automatic Speech Recognition (ASR) systems using official parliamentary proceedings.

Use Cases

Evaluate ASR word error rates (WER) using the provided orthographic transcriptions as ground truth.
Compare speech recognition accuracy across Norwegian Bokmål and Norwegian Nynorsk written standards.
Develop acoustic models for parliamentary domain speech using the audio and text pairs.

Strengths

Contains orthographic transcriptions in Norwegian Bokmål and Norwegian Nynorsk.
Features audio recordings from official Norwegian Parliament (Stortinget) sessions.
Provides a dedicated test split for evaluating Norwegian ASR model performance.

AUDIOFOLDER Source Datasetsoriginal Modalityaudio Language Creatorsfound Licensecc0 10 Languageno Size Categoriesn1 K Annotations Creatorsno Annotation Librarymlcroissant Task Categoriesaudio Classification Librarydatasets Languagenn Regionus Speech Modeling Task Categoriesautomatic Speech Recognition Multilingualitymonolingual Languagenb

Related Datasets

Quality Score

D30

Description

Source

Reputation

Quality Score

D30

Description

Source

Reputation

Access

Community

382 downloads

0 views

Dataset Info

Author: NbAiLab
Created: Mar 2, 2022
Updated: Nov 7, 2022
Last synced: Apr 29, 2026

Access

Community

382 downloads

0 views

Dataset Info

Author: NbAiLab
Created: Mar 2, 2022
Updated: Nov 7, 2022
Last synced: Apr 29, 2026

NPSC: Norwegian Parliament Speech Corpus (Test Set)

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info