🗂 BDD brute — Panorama corpus complet

Méthodologie

Snapshot de la base PostgreSQL du scraper Reddit (tables posts + comments). Aucune sélection : on décrit ici le corpus brut, avant tout filtre thématique.

Fiche dataset

Vue d'ensemble normalisée du corpus (pour la section méthodes du papier).

Subreddits	20 — r/kdramas, r/KoreanFood, r/korea, r/InstantRamen, r/squidgame, r/koreanvariety, r/asiandrama, r/kdramarecommends…
Période couverte	2011-06-10 → 2026-05-21
Posts	39 765
Commentaires	1 144 614
Auteurs uniques	213 465
Langue principale	anglais
Commentaires médians par fil	13
Profondeur max observée	9 niveaux
Exclusions	commentaires au corps vide écartés des analyses textuelles
Anonymisation	pseudonymes non affichés ; verbatims reliés au fil source
Politique de citation	extraits courts, lien vers le commentaire Reddit d'origine

Vue d'ensemble

Évolution temporelle

Volume mensuel de posts et de commentaires.

🗂 BDD brute — Panorama corpus complet

Méthodologie

Fiche dataset

Vue d'ensemble

Évolution temporelle

Subreddits

Structure des discussions

Profondeur des fils (depth)

Top words — de quoi parle le corpus