Danger
des statistiques.
Erreurs de première
espèce, de deuxième espèce, autres erreurs – attention, voici deux exemples
courants, et les catastrophes qui en découlent. Ces exemples sont inspirés du
livre « The power of logical thinking » de Marilyn Vos Savant (*),
mais sont très courants.
1.
Test de
drogue. On admettra les deux hypothèses suivantes :
- 5 % des gens se droguent.
- la fiabilité du test est de .95.
Quelle est la probabilité pour qu’un individu choisi au hasard et pour lequel le test s’avère positif soit un drogué ?
Prenons une population de 10.000 personnes. (dont 9.500 non drogués et 500 drogués). Le test sera positif pour 5 % des non drogués, soit pour 475 non drogués. Il sera également positif pour 95 % des drogués, soit pour 475 drogués. La probabilité cherchée est de 0,5 !!
2. Cancer du sein. On admettra les deux
hypothèses suivantes :
- 1 % des femmes qui présentent une grosseur au sein ont un cancer du sein.
- La fiabilité d’une mammographie est de .8 pour les cancers et de .9 pour les tumeurs bénignes.
et pour laquelle la mammographie est positive ait un cancer du sein ?
La simple application du théorème de Bayes donne :
P(cancer | positif) =
P(positif | cancer) x P(cancer)
P(positif | cancer) x P(cancer) +
P(positif | bénigne) x P (bénigne)
La probabilité cherchée est donc de (0,8 x 0,01)/[(0,8 x 0,01) + (0,1 x 0,99)] = 0,075.
Il y a donc 7,5 chances sur cent d’être en présence d’un cancer du sein. Sur 100 médecins interrogés, plus de 90 ont estimé cette probabilité à environ 0,75 !!
*. Dans ce livre sont expliquées de manière claire les principales faiblesses du raisonnement humain. Citons :
- La tendance à linéariser tous les problèmes.
- La confiance erronée en l’ « intuition » (qui linéarise !).
- L’incapacité d’appréhender globalement un problème.
- La non-compréhension des notions de probabilité et de statistique.
- La crédulité.