Aller au contenu principal

Méthodologie de scoring de biais

Version 1.0.0 · Transparence méthodologique totale

Principes fondamentaux

  1. Transparence méthodologique — Chaque score est reproductible et documenté. Les algorithmes, les poids et les formules sont publics.
  2. Neutralité algorithmique — Aucune opinion éditoriale dans les algorithmes. Les scores mesurent des indicateurs structurels, pas des positions politiques.
  3. Versioning — Chaque calcul est versionné (1.0.0) pour traçabilité complète.

Échelle de scoring

Les scores sont contraints dans l'intervalle [-1.0, +1.0].

-1.0 ————— -0.6 ————— -0.3 ————— 0.0 ————— +0.3 ————— +0.6 ————— +1.0
Biais fort   Biais modéré   Zone neutre   Neutre   Zone neutre   Biais modéré   Biais fort
Plage Interprétation Badge
[-1.0, -0.6] Biais structurel fort — lacunes majeures en diversité, attribution ou couverture -0.80
[-0.6, -0.3] Biais modéré — certaines faiblesses structurelles identifiées -0.47
[-0.3, +0.3] Zone neutre — équilibre structurel satisfaisant +0.05
[+0.3, +0.6] Biais modéré positif — bonne diversité, quelques déséquilibres +0.45
[+0.6, +1.0] Très bonne rigueur structurelle sur tous les indicateurs +0.85
Ce que le score ne mesure pas : Le score n'évalue pas l'orientation politique (gauche/droite) ni la qualité rédactionnelle. Il mesure des indicateurs structurels : diversité des sujets, attribution des sources, couverture thématique, régularité de publication.

Les 3 axes d'analyse

Chaque média et journaliste est évalué sur 3 axes indépendants, puis un score agrégé est calculé.

Axe idéologique poids : 35%

Évalue la diversité et l'équilibre de la couverture éditoriale. Un score élevé indique une couverture diversifiée et régulière.

IndicateurPoidsMéthode de calcul
diversite_sujets 30% Ratio sujets distincts / articles (seuil 30%)
equilibre_angles 30% Uniformité de la distribution des angles éditoriaux
entropie_thematique 25% Entropie de Shannon normalisée sur la distribution des sujets
regularite_temporelle 15% Coefficient de variation inversé des intervalles de publication
Axe fiabilité poids : 35%

Évalue la rigueur et la traçabilité journalistique. Un score élevé indique des articles bien sourcés et attribués.

IndicateurPoidsMéthode de calcul
diversite_sources 30% Ratio journalistes distincts / articles (seuil 40%)
taux_attribution 25% Proportion d'articles signés par un journaliste identifié
taux_sujets 25% Proportion d'articles rattachés à un sujet catégorisé
fraicheur 20% Proportion d'articles publiés dans les 30 derniers jours
Axe pluralisme poids : 30%

Évalue la diversité des points de vue et la couverture thématique. Un score élevé indique un média pluraliste.

IndicateurPoidsMéthode de calcul
couverture_thematique 30% Ratio sujets couverts / sujets existants dans la base
diversite_sources 25% Nombre moyen de médias couvrant les mêmes sujets
equilibre_opinions 25% Entropie de Shannon sur la distribution des angles
factualite 20% Proportion d'articles complets (sujet + journaliste + date)

Score agrégé

Le score global combine les 3 axes avec les poids suivants :

score = (idéologique × 0.35) + (fiabilité × 0.35) + (pluralisme × 0.30)

Le résultat est contraint dans [-1.0, +1.0] et arrondi à 4 décimales. Pour des données identiques et une même version de méthode, les scores sont strictement reproductibles (pas de composante aléatoire).

Formules mathématiques

Score par axe
score(axe) = Σ(indicateurk × poidsk) / Σ(poidsk)
Entropie de Shannon normalisée

Utilisée pour entropie_thematique et equilibre_opinions :

H = -Σ(pi × log2(pi))
Hnorm = H / log2(n)

Hnorm = 1.0 signifie une distribution parfaitement uniforme (maximum de diversité). Hnorm = 0.0 signifie une concentration totale sur une seule catégorie.

Niveaux de granularité

GranularitéContenu
Courte Score agrégé uniquement. Synthèse en 1 phrase. Pas de comparaisons.
Moyenne Scores détaillés par axe + indicateurs intermédiaires. Synthèse en 1 paragraphe.
Longue Tous indicateurs + historique + comparaisons inter-médias + synthèse narrative complète.
Contrainte paywall (immuable)

Les scores sont calculés sur les métadonnées structurelles des articles (sujets, angles, attributions, temporalité), jamais sur le contenu intégral. RESET.PRESS n'accède jamais au contenu protégé par un paywall.

Limites de la méthode

  • Les indicateurs sont des proxys structurels, pas des analyses sémantiques du contenu des articles.
  • La diversité des sujets dépend de la qualité de la catégorisation dans la base.
  • Le score ne mesure ni l'orientation politique, ni la qualité rédactionnelle, ni la véracité des informations.
  • Les comparaisons inter-médias ne sont pertinentes qu'à volumes d'articles comparables.

Version méthode : 1.0.0 · Service : BiasScorer · Code source public