L’INTERPRETATION DE TESTS STATISTIQUES

 

Albert FRANK

 

PREMIERE PARTIE

 

            Dans ce qui suit, nous admettons l’hypothèse suivante : si un test dichotomique a une fiabilité f, la probabilité pour qu’il donne un résultat erroné est 1-f.

 

            La question suivante se pose : en dessous de quelle fiabilité un test indique-t-il un résultat dont la probabilité d’être correcte est inférieure à 0,5 ?

 

            Soit P la taille de la population, a la probabilité (connue) pour qu’un individu de cette population ait une certaine propriété K, et f la fiabilité du test. Le nombre d’individus K  détectés par le test est afP. Le nombre d’individus non-K détectés (à tort) est (1-a)(1-f)P. La probabilité pour qu’un individu détecté par le test soit un K individu vaut 0,5 si

afP=(1-a)(1-f)P, c’est-à-dire si f=1-a. Ainsi, dès que f£a, le test n’a plus aucun sens.

Un test devra être d’autant plus fiable que ce qu’il cherche à détecter est rare.

 

Dans la pratique, cet aspect simple est bien souvent négligé.

 

Prenons l’exemple suivant : l’alcool test. Nous admettrons comme hypothèse qu’un conducteur sur 100 est à  « 0.8 ou plus » (norme européenne de faute grave). Dans le tableau qui suit, examinons pour diverses fiabilités du test la probabilité pour qu’un individu révélé positif le soit réellement. Nous travaillons sur une population de 100000 individus, dont 1000 seront supposés « à 0.8 ou plus ».

 

Fiabilité du test

Nb. « 0.8 détectés »

Nb. « non 0.8 »

détectés

Proba « le détecté est à 0.8 »

.999

999

99

0,91

.99

990

990

0,5

.95

950

4950

0,16

.9

900

9900

0,08

.8

800

19800

0,04

 

            Nous imaginons les dangers de mauvaises interprétations de tests, par exemple dans le domaine médical.

 

DEUXIEME PARTIE

 

Dans la première partie, nous avons admis l'hypothèse suivante: si un test dichotomique a une fiabilité f, la probabilité pour qu’il donne un résultat erroné est 1-f.

 

Essayons maintenant de voir ce qui se passe si nous n'admettons pas cette hypothèse.

 

Appelons P le nombre d'éléments dans la population, a la probabilité (connue) pour un élément de cette population d’avoir la propriété K , f1 la probabilité pour qu'un K-Element soit détecté comme un K-Element, et f2 la probabilité pour qu'un non-K-élément ne soit pas détecté erronément par le test. Dans les cas pratiques, nous avons f1 < f2.

 

Le nombre de K-Elements détectés par le test est égal à  a.f1.P. Le nombre de non-K-éléments  détectés incorrectement est égal à (1-a).(1-f2).P. La probabilité pour qu'un élément détecté par le test soit un K-Element sera de 0,5 si a.f1.P = (1-a).(1-f2).P. Ceci équivalent à

f 2 = 1 + af1/(a -1). (*)

 

Le test n’a plus de sens si f2 < 1 + af1/(a-1).

 

La quantité a/(a-1) est habituellement très petite (Pour a = .01, ce rapport devient -1/99 et la condition (*) devient f2 = 1-f1/99)

 

Pour a = 0.01 et toute valeur raisonnable de f1 entre 0.8 et 0.999, l'épreuve n’aura aucun sens si f2 < 0.99 !!

 

Cela peut être montré facilement avec l'exemple suivant: Dans une population de 100,000 éléments, prenons a = 0.01. Donc 1000 éléments seront réellement K-Elements. Si f2 < 0.99, plus qu'un pour cent des non-K-éléments  (ce qui est plus que 990) seront détectés incorrectement comme K-Elements. Et même si f1 avait la valeur 1 (tout les K-Elements sont détectés), bien que nous ayons encore les 1000 détections correctes, nous aurions aussi plus que 990 détections incorrectes.