DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Uncivil Reddit: A Dataset of Online Discourse | DataSalon

Home Media & CommunicationUncivil Reddit: A Dataset of Online Discourse

Media & Communication

Uncivil Reddit: A Dataset of Online Discourse

Name: Uncivil Reddit: A Dataset of Online Discourse
Creator: Anonymous Anon
Published: 2026-05-04T10:51:15
License: CC-BY-4.0
Keywords: Reddit, CSV, Social Media, Text, Tabular, Online Discourse, Text Corpus

by Anonymous Anon·Updated 1mo ago

242.2 MB4files

Available on 1 platform

Description

Uncivil Reddit is a text dataset from the figshare platform, published under a CC-BY-4.0 license. The dataset is 242.2 MB in size and is available in CSV and R file formats. It was last updated on May 4, 2026, by an author listed as Anonymous Anon.

Use Cases

Training models to detect uncivil or toxic language in online comments (inferred from domain, verify after download)
Analyzing discourse patterns and community interactions on social media platforms (inferred from domain, verify after download)
Benchmarking natural language processing tools for sentiment or conflict analysis (inferred from domain, verify after download)

Strengths

Published on the figshare platform with a permissive CC-BY-4.0 license.
Dataset size is 242.2 MB, indicating a medium-scale collection.
Available in multiple formats, including CSV and R, for accessibility.

Limitations

Metadata is minimal; actual content requires verification after download.
Row count and column definitions are unknown, limiting suitability assessment.
Data may reflect temporal or source bias inherent to its collection from Reddit.

Provenance

Source: figshare
Freshness: Last updated 2026-05-04 10:51:15.

Text Tabular CSV Reddit Social Media Online Discourse Text Corpus

Related Datasets

Quality Score

D39

Description

Source

Reputation

Quality Score

D39

Description

Source

Reputation

Access

Community

0 views

Dataset Info

License: CC-BY-4.0
Author: Anonymous Anon
Files: 4
Created: May 4, 2026
Updated: May 4, 2026
DOI
Last synced: May 4, 2026

Access

Community

0 views

Dataset Info

License: CC-BY-4.0
Author: Anonymous Anon
Files: 4
Created: May 4, 2026
Updated: May 4, 2026
DOI
Last synced: May 4, 2026

Uncivil Reddit: A Dataset of Online Discourse

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info