Dans ce qui suit, nous admettons l’hypothèse suivante : si un test dichotomique a une fiabilité f, la probabilité pour qu’il donne un résultat erroné est 1-f.
La question suivante se pose : en dessous de quelle fiabilité un test indique-t-il un résultat dont la probabilité d’être correcte est inférieure à 0,5 ?
Soit P la taille de la population, a la probabilité (connue) pour qu’un individu de cette population ait une certaine propriété K, et f la fiabilité du test. Le nombre d’individus K détectés par le test est afP. Le nombre d’individus non-K détectés (à tort) est (1-a)(1-f)P. La probabilité pour qu’un individu détecté par le test soit un K individu vaut 0,5 si
afP=(1-a)(1-f)P, c’est-à-dire si f=1-a. Ainsi, dès que f£a, le test n’a plus aucun sens.
Un test devra être d’autant plus fiable que ce qu’il cherche à détecter est rare.
Dans la pratique, cet aspect simple est bien souvent négligé.
Prenons l’exemple suivant : l’alcool test. Nous admettrons comme hypothèse qu’un conducteur sur 100 est à « 0.8 ou plus » (norme européenne de faute grave). Dans le tableau qui suit, examinons pour diverses fiabilités du test la probabilité pour qu’un individu révélé positif le soit réellement. Nous travaillons sur une population de 100000 individus, dont 1000 seront supposés « à 0.8 ou plus ».
|
Fiabilité du test |
Nb. « 0.8 détectés » |
Nb. « non 0.8 » détectés |
Proba « le détecté est à 0.8 » |
|
.999 |
999 |
99 |
0,91 |
|
.99 |
990 |
990 |
0,5 |
|
.95 |
950 |
4950 |
0,16 |
|
.9 |
900 |
9900 |
0,08 |
|
.8 |
800 |
19800 |
0,04 |
Nous imaginons les dangers de mauvaises interprétations de tests, par exemple dans le domaine médical.
DEUXIEME PARTIE
Dans la première partie, nous avons admis l'hypothèse suivante: si un test dichotomique a une fiabilité f, la probabilité pour qu’il donne un résultat erroné est 1-f.
Essayons
maintenant de voir ce qui se passe si nous n'admettons pas cette hypothèse.
Appelons P le nombre d'éléments dans la
population, a la probabilité (connue) pour un élément de cette population
d’avoir la propriété K , f1 la probabilité pour qu'un K-Element soit détecté
comme un K-Element, et f2 la probabilité pour qu'un non-K-élément ne soit pas
détecté erronément par le test. Dans les cas pratiques, nous avons f1 < f2.
Le nombre de K-Elements détectés par le test est
égal à a.f1.P. Le nombre de
non-K-éléments détectés incorrectement
est égal à (1-a).(1-f2).P. La probabilité pour qu'un élément détecté par le
test soit un K-Element sera de 0,5 si a.f1.P = (1-a).(1-f2).P. Ceci équivalent
à
f 2 = 1 + af1/(a -1). (*)
Le test n’a plus de sens si f2 < 1 + af1/(a-1).
La quantité a/(a-1) est habituellement très petite
(Pour a = .01, ce rapport devient -1/99 et la condition (*) devient f2 =
1-f1/99)
Pour a = 0.01 et toute valeur raisonnable de f1
entre 0.8 et 0.999, l'épreuve n’aura aucun sens si f2 < 0.99 !!
Cela peut être montré facilement avec l'exemple
suivant: Dans une population de 100,000 éléments, prenons a = 0.01. Donc 1000
éléments seront réellement K-Elements. Si f2 < 0.99, plus qu'un pour cent
des non-K-éléments (ce qui est plus que
990) seront détectés incorrectement comme K-Elements. Et même si f1 avait la
valeur 1 (tout les K-Elements sont détectés), bien que nous ayons encore les
1000 détections correctes, nous aurions aussi plus que 990 détections
incorrectes.