Méthodologie de scoring de biais
Version 1.0.0 · Transparence méthodologique totale
Principes fondamentaux
- Transparence méthodologique — Chaque score est reproductible et documenté. Les algorithmes, les poids et les formules sont publics.
- Neutralité algorithmique — Aucune opinion éditoriale dans les algorithmes. Les scores mesurent des indicateurs structurels, pas des positions politiques.
- Versioning — Chaque calcul est versionné (
1.0.0) pour traçabilité complète.
Échelle de scoring
Les scores sont contraints dans l'intervalle [-1.0, +1.0].
Biais fort Biais modéré Zone neutre Neutre Zone neutre Biais modéré Biais fort
| Plage | Interprétation | Badge |
|---|---|---|
[-1.0, -0.6] |
Biais structurel fort — lacunes majeures en diversité, attribution ou couverture | -0.80 |
[-0.6, -0.3] |
Biais modéré — certaines faiblesses structurelles identifiées | -0.47 |
[-0.3, +0.3] |
Zone neutre — équilibre structurel satisfaisant | +0.05 |
[+0.3, +0.6] |
Biais modéré positif — bonne diversité, quelques déséquilibres | +0.45 |
[+0.6, +1.0] |
Très bonne rigueur structurelle sur tous les indicateurs | +0.85 |
Les 3 axes d'analyse
Chaque média et journaliste est évalué sur 3 axes indépendants, puis un score agrégé est calculé.
Évalue la diversité et l'équilibre de la couverture éditoriale. Un score élevé indique une couverture diversifiée et régulière.
| Indicateur | Poids | Méthode de calcul |
|---|---|---|
diversite_sujets |
30% | Ratio sujets distincts / articles (seuil 30%) |
equilibre_angles |
30% | Uniformité de la distribution des angles éditoriaux |
entropie_thematique |
25% | Entropie de Shannon normalisée sur la distribution des sujets |
regularite_temporelle |
15% | Coefficient de variation inversé des intervalles de publication |
Évalue la rigueur et la traçabilité journalistique. Un score élevé indique des articles bien sourcés et attribués.
| Indicateur | Poids | Méthode de calcul |
|---|---|---|
diversite_sources |
30% | Ratio journalistes distincts / articles (seuil 40%) |
taux_attribution |
25% | Proportion d'articles signés par un journaliste identifié |
taux_sujets |
25% | Proportion d'articles rattachés à un sujet catégorisé |
fraicheur |
20% | Proportion d'articles publiés dans les 30 derniers jours |
Évalue la diversité des points de vue et la couverture thématique. Un score élevé indique un média pluraliste.
| Indicateur | Poids | Méthode de calcul |
|---|---|---|
couverture_thematique |
30% | Ratio sujets couverts / sujets existants dans la base |
diversite_sources |
25% | Nombre moyen de médias couvrant les mêmes sujets |
equilibre_opinions |
25% | Entropie de Shannon sur la distribution des angles |
factualite |
20% | Proportion d'articles complets (sujet + journaliste + date) |
Score agrégé
Le score global combine les 3 axes avec les poids suivants :
Le résultat est contraint dans [-1.0, +1.0] et arrondi à 4 décimales. Pour des données identiques et une même version de méthode, les scores sont strictement reproductibles (pas de composante aléatoire).
Formules mathématiques
Score par axe
Entropie de Shannon normalisée
Utilisée pour entropie_thematique et equilibre_opinions :
Hnorm = H / log2(n)
Hnorm = 1.0 signifie une distribution parfaitement uniforme (maximum de diversité). Hnorm = 0.0 signifie une concentration totale sur une seule catégorie.
Niveaux de granularité
| Granularité | Contenu |
|---|---|
| Courte | Score agrégé uniquement. Synthèse en 1 phrase. Pas de comparaisons. |
| Moyenne | Scores détaillés par axe + indicateurs intermédiaires. Synthèse en 1 paragraphe. |
| Longue | Tous indicateurs + historique + comparaisons inter-médias + synthèse narrative complète. |
Contrainte paywall (immuable)
Les scores sont calculés sur les métadonnées structurelles des articles (sujets, angles, attributions, temporalité), jamais sur le contenu intégral. RESET.PRESS n'accède jamais au contenu protégé par un paywall.
Limites de la méthode
- Les indicateurs sont des proxys structurels, pas des analyses sémantiques du contenu des articles.
- La diversité des sujets dépend de la qualité de la catégorisation dans la base.
- Le score ne mesure ni l'orientation politique, ni la qualité rédactionnelle, ni la véracité des informations.
- Les comparaisons inter-médias ne sont pertinentes qu'à volumes d'articles comparables.
Version méthode : 1.0.0
· Service : BiasScorer
· Code source public