🗂 BDD brute — Panorama corpus complet

← Accueil

Méthodologie

Snapshot de la base PostgreSQL du scraper Reddit (tables posts + comments). Aucune sélection : on décrit ici le corpus brut, avant tout filtre thématique.

Fiche dataset

Vue d'ensemble normalisée du corpus (pour la section méthodes du papier).

Subreddits20 — r/kdramas, r/KoreanFood, r/korea, r/InstantRamen, r/squidgame, r/koreanvariety, r/asiandrama, r/kdramarecommends…
Période couverte2011-06-10 → 2026-05-21
Posts39 765
Commentaires1 144 614
Auteurs uniques213 465
Langue principaleanglais
Commentaires médians par fil13
Profondeur max observée9 niveaux
Exclusionscommentaires au corps vide écartés des analyses textuelles
Anonymisationpseudonymes non affichés ; verbatims reliés au fil source
Politique de citationextraits courts, lien vers le commentaire Reddit d'origine

Vue d'ensemble

Évolution temporelle

Volume mensuel de posts et de commentaires.

Subreddits

Structure des discussions

Profondeur des fils (depth)

Top words — de quoi parle le corpus