Le forum

 

Pas de DHTML sans Internet Explorer V4 ou Netscape V4

La notion de "mot-clé" et sa difficile application pédagogique.

Auteurs :
Commission "Français et Informatique

Plus que jamais, l'élève doit se servir de mots-clés: le développement de l'internet, l'utilisation régulière de moteurs de recherche demandent que l'on se serve de mots-clés pour travailler.
L'expérience montre cependant que leur utilisation correcte nécessite un apprentissage, et que la notion même de mot-clé n'est pas comprise de la même manière par tous.
Pour les élèves (mais aussi pour les adultes !), la difficulté de cerner précisément la notion de mot-clés est le résultat de la différence entre la manière humaine de réfléchir et le traitement formel, seule chose dont est capable l'ordinateur, dans l'état actuel des recherches.

 

La notion de "mot-clé"

1. Quelques situations

Vous demandez que les élèves recherchent des renseignements sur " La Guerre du Feu " , le roman de Rosny.
Vos élèves proposent d'aller voir sur internet ce qu'on peut trouver sur le sujet. Ils vont donc utiliser un moteur de recherche.
Que font vos élèves ? Ils introduisent spontanément comme mot-clé dans la zone ad hoc d'un moteur de recherche les mots : guerre du feu .
Résultat ? ils reçoivent en retour plus de 12000 sites ! Bien sûr, il y a quelque part sur la toile une page qui traite du sujet, mais où ?
Les résultats obtenus traitent de la guerre , il y a aussi des renseignements sur la verrerie , sur la céramique , des sites publicitaires pour des poêles , et même un ou deux récits érotiques dont on se demande bien pour quelle raison il apparaît dans cet inventaire ... Quant à ce qui est attendu, point !

Vous construisez une séquence de cours sur le romantisme avec les élèves. Lors d'un remue-méninges sur tout ce qu'il serait intéressant de rechercher, vous suggérez qu'un groupe travaille sur les origines du courant romantique en France .
Résultats ? Les élèves râlent et pestent, car " ils ne trouvent rien "... Si vous leur demandez comment ils s'y sont pris pour chercher, beaucoup vous répondront invariablement " on a employé un moteur de recherche, M'sieur ". Oui, mais avec quels mots-clés ? "Avec origine courant romantique ".
L'origine du courant romantique en France est quelque chose de bien défini ; le courant romantique a fait l'objet d'abondantes études, et pourtant, les résultats parlent d' électricité , de chanson , ... Bref, de tout sauf de ce qui est souhaité!

Que dire alors du mot-clé Jean de la Fontaine qui, si on oublie les majuscules, vous fait entrer dans l'univers du prêt-à-porter, avec le jean denim !

2. Que s'est-il passé ?

Vos élèves ont réagi humainement : " La Guerre du Feu " est un roman, c'est bien entendu... Quand ils en parlent, il y a un contexte qui éclaire ce qui est dit. Si quelqu'un en parle en-dehors d'un contexte " normal ", il dira " J'ai lu le roman " La Guerre du Feu ".

Les origines du romantisme , c'est chose abondamment commentée; ça veut bien dire ce que ça veut dire, non? Même si j'oublie une majuscule, ça ne change rien à ce que je veux dire...! C'est vrai dans le cas d'un usage normal, mais pas quand il s'agit d'informatique

Un moteur de recherche n'est qu'un programme informatique. Il ne peut traiter que des suites de nombres binaires, des octets ... Le contexte, le sens, " ce que j'ai voulu dire... " : aucun moteur de recherches n'est capable d'en tenir compte actuellement. La langue naturelle n'est compréhensible que par les humains; les moteurs de recherche ne traitent que des mots séparés, qu'il cherchera dans une base de données qu'il s'est constituée en indexant certaines parties des documents (les pages web) qui lui sont soumis.

3. Le mot-clé pour le professeur de français

Avant la vulgarisation de l'univers informatique, la notion de "mot-clé" était utilisée dans le secteur de la documentation, mais aussi par le professseur de français.
Celui-ci désigne encore parfois cette notion par " mot-étiquette ", quand les élèves travaillent sur le vocabulaire, ou quand ils étudient un texte.

Dans l'univers scolaire, un mot-clé, c'est un mot porteur du sens, un " supermot ", celui qui permettra au lecteur de découvrir l'idée qui est tissée autour de lui. De ce point de vue, les professeurs de français apprennent à utiliser des mots-clés pour synthétiser les informations fournies par un texte.

Les scientifiques disent que les mots-clés concentrent le sens, par des relations d' implication et d' inclusion , autrement dit par intégration .

  • Train - avion - bateau - métro - moto ont pour mot-clé "moyen de transport"
  • "média" est le mot-clé qui peut remplacer presse - télévision - internet - radio - affiche...

Une grande partie des apprentissages relatifs à la maîtrise des textes d'information suppose la maîtrise des mots-clés entendus comme des éléments qui intègrent des contenus de sens. De la sorte, il est possible de résumer, de structurer des textes, de synthétiser des connaissances.

3.1. Un peu de sémantique, où il est question d'hyponymie et d'hyperonymie...

Quelle est la relation entre les signes suivants : rose, iris et fleur ?
  1. Si ceci est une rose , alors ceci est une fleur ,
  2. Si ceci est un iris , alors ceci est une fleur ,
  3. Iris et rose sont des hyponymes de fleur
  4. Si ceci est une fleur , cela n'implique pas que ce soit une rose
  5. Si ceci est une fleur , cela n'implique pas que ce soit un iris .
  6. Fleur contient iris et rose
  7. Fleur est l' hyperonyme de iris et rose .
Quand le professeur de français demande à ses élèves de travailler avec des mots-clés, il leur demande donc de manière implicite de manipuler des termes de préférence hyperonymes ou génériques, parce que l'hyperonyme est porteur d'un sens plus large que l'hyponyme ou spécifique.
C'est ce travail qui est demandé lors d'exercices de prise de notes, de structuration de textes, de comptes rendus et de contraction de textes... Dans ce cas, l'élève doit générer des termes hyperonymes qui intègrent les informations fournies par les termes hyponymes rencontrés dans la source.
Sur ce sujet, on peut utilement consulter :
CLOES (Chr.) et ROLLIN (Y.), Le Résumé 1 - Application de quelques techniques de contraction de texte, Dessain, 1994.

4 Le mot-clé pour l'utilisateur d'internet.

Quand il s'agit d'internet, mais aussi de bases de données, un mot-clé est une chaîne de caractères , et rien d'autre !

Quand on exécute une recherche par mot-clé avec un moteur de recherche, on fait exécuter par un logiciel une comparaison entre une chaîne de caractères et l'ensemble des chaînes contenues dans une base de données. Jamais la sémantique n'est abordée. Point d'implication, d'inclusion, ... Seule existe l'identité de forme.
Par contre, des phénomènes de synonymie, d'homonymie, de polysémie .... viendront perturber la qualité des résultats d'une recherche. La langue française, dont la richesse fut vantée pendant des siècles, pose des problèmes particulièrement ardus aux concepteurs de moteurs de recherche, qui ne peuvent pas utiliser aveuglément les routines élaborées par les concepteurs anglophones, langue dont la fréquence de synonymie, polysémie et homonymie est nettement moins élevée.

4.1. La synonymie

Une demande d'information sur les " automobiles " laissera de côté une kyrielle de pages qui évoquent les " voitures ". Dans l'esprit de l'utilisateur, l'auto est une voiture ;
pour le moteur de recherche, ce sont deux chaînes différentes.

4.2. La polysémie

Une simple requête sur " jaguar " donnera des milliers de pages concernant, entre autres, l'automobile de ce nom, le félin, mais aussi une équipe de football américain.
Pour l'utilisateur, le félin et l'automobile sont deux notions différentes, pour le moteur de recherche, la chaîne est identique...

4.3 L'homonymie

Une requête sur " canon " amènera des pages concernant les armes et la théologie...
Une requête sur " grève " vous fera entrer dans l'univers de la revendication ,mais aussi dans celui, plus paisible, de la mer, ou encore à Paris, sur la Place de Grève...
Le français étant une langue à flexionnelle (les mots se modifient à l'aide d'éléments - les désinences - qui expriment certains aspects et rapports grammaticaux), des surprises peuvent parfois se révéler.
Certains résultats sont surréalistes, alors que le moteur de recherche a tout simplement indexé une chaîne flexionnelle homonyme. Celle qui cherche un couvent se retrouve dans un nid!

5 Les difficultés des élèves

Le professeur de français travaille de manière " rétrospective "

Sa consigne se résume en général à l'instruction suivante : "étant donné un texte, quels mots-clés peut-on isoler ou générer pour rendre compte de la signification du texte ? " L'aspect rétrospectif est rassurant pour l'élève. Il s'appuie sur un objet-texte ; il peut y recourir ; l'expansion sémantique du mot-clé qu'il propose est déjà réalisée...

La tendance à fournir des termes hyperonymes est spontanée, car tout l'enseignement va dans ce sens...

Mais quand l'élève est confronté à une recherche par moteur, il doit agir mentalement de manière inverse : plus question de sémantique : rien d'autre qu'une chaîne de caractères.

Face à un moteur de recherche, la démarche est prédictive : il faut prévoir que la chaîne va se trouver dans le texte cherché.

La situation est déstabilisante, puisqu'il faut présumer une chaîne de caractères qui pourrait apparaître dans un document. L'idéal à atteindre, c'est la chaîne de caractères suffisamment spécifique pour n'apparaître QUE dans le document souhaité.
En ce sens, le bon mot-clé est celui qui est suffisamment adéquat mais surtout suffisamment peu fréquent pour que le moteur de recherche l'ait indexé peu de fois. Peu de pages indexées avec ce mot-clé, mais des pages adéquates.

Il est déconseillé d'utiliser des termes hyperonymes , très fréquents, et qui génèrent de ce fait bien trop de résultats de recherche. Il faudra absolument utiliser les termes hyponymes pour que la recherche soit rentable, en tenant compte que la rentabilité est liée à l'adéquation du mot-clé et à sa faible fréquence d'apparition dans les pages.

Or la recherche des hyponymes est directement déterminée par la compétence lexico-sémantique de l'élève. Plus son vocabulaire sera riche, plus il pourra présumer le terme adéquat qui permettra de détecter la page spécifique à son attente. Dans le cas où il ne connaît rien encore du domaine dans lequel il mène sa recherche, on se trouve là devant ce que les pédagogues nomment un paradoxe pragmatique . "Utilisez comme mot-clé un terme très spécifique que vous ne connaissez pas encore".

A ce sujet, un site propose une démarche progressive qui mène à la détermination de mots-clés qui pertinents :Chercher pour trouver

6. Hypothèse

Dans un premier temps, c'est au professeur de fournir les mots-clés adéquats, puisqu'il est l'expert, alors que l'élève n'a que des idées générales sur le sujet donné.
Il faut aussi qu'il initie l'élève à la création de réseaux sémantiques hyponymes autour de thèmes, en précisant que les hyponymes sont plus " rentables ".
Cette réflexion s'appuie sur le seul postulat que les pages dans lesquelles les hyperonymes sont utilisés ont été élaborées par des généralistes, alors que les pages contenant les hyponymes l'ont été par des experts. Mais ce postulat peut être douteux... du moins personne n'a encore confirmé de manière expérimentale cette intuition !

 

Améliorer la recherche par mots-clés

Compte tenu de ce qui est précisé dans la première partie, il y a peu de chance qu'un seul terme utilisé comme mot-clé fournisse des résultats adéquats et peu nombreux. Les moteurs de recherche tiennent compte de cet aléa en permettant une recherche combinant les chaînes de caractères à chercher.
L'utilisation de mots-clés multiples vous donnera souvent de meilleurs résultats. Si, par exemple, vous cherchez de l'information sur la recherche sur le cancer effectuée sur des souris, entrer recherche experience souris cancer donnera de meilleurs résultats que recherche cancer sur les souris . Plusieurs pages utiliseront " experience " plutôt que " recherche " et les pages contenant les deux mots seront probablement plus pertinentes à votre recherche.
Les moteurs permettent de créer un réseau sémantique par addition ou exclusion de chaînes, mais c'est à l'utilisateur de déterminer les chaînes à associer et celles à exclure, en fonction de la sémantique.
De la sorte peut se constituer une détermination sémantique par traits pertinents (jaguar MAIS PAS automobile ; essence ET philosophie ; chien OU canidé, ...)

En informatique, l'algèbre de Boole est utilisée pour créer cette détermination sémantique.

1. Conseil général

Par défaut, écrire les mots-clés en minuscules et sans accents .
Utiliser les majuscules et les accents pour restreindre la portée de la recherche (c'est l'option la plus simple pour chercher sur des noms propres...)

Jean de la Fontaine

2. Les options de recherche

Presque tous les moteurs de recherche offrent des options supplémentaires afin de préciser une recherche par un ou des mot(s)-clé(s). Ces options s'utilisent en exploitant les possibilités de la recherche avancée.

Espace

Par défaut, l'espace est considéré comme un séparateur de chaîne, mais aussi comme l'expression de l'addition de chaînes. Il équivaut à [+] ou [AND] (voir ci-dessous)

Guillemets (" ")

Si des guillemets entourent un groupe de mots, le moteur de recherche les interprétera comme une chaîne unique et non comme des mots séparés. Les résultats correspondront aux pages qui contiennent la chaîne exacte.

Essentiel / Exclure (+/-)

Les symboles [+] ou [-] devant des mots-clés les identifie comme essentiels [+] ou les exclut [-] de votre recherche. L'équivalent booléen est [AND] ou [AND NOT].

Caractère générique (Wildcard) (*)

Le caractère générique est utilisé pour chercher plusieurs formes possibles d'un mot-clé. Il permet par exemple de remplacer la flexion grammaticale d'un verbe pour que la chaîne corresponde au radical, mais que le moteur tienne compte de toutes les flexions.
En ajoutant un astérisque (*) à la fin d'un mot, comme dans program*, le moteur cherchera le terme "program" ainsi que "programme", et "programmation" ; "programmons"

3. les opérateurs booléens AND, OR, NOT, NEAR

Les opérateurs booléens doivent être utilisés en majuscules.

Utilisez AND pour vous assurer que tous les mots-clés apparaissent dans le résultat de la recherche.

Exemple: Canterbury AND Chaucer.

Utilisez OR pour vous assurer qu'au moins un des mots-clés apparaîtra dans le résultat de la recherche.

Exemple: Canterbury OR Chaucer

Utilisez NOT pour vous assurer qu'un certain terme n'apparaît pas dans le résultat de la recherche.
Certains moteurs de recherche, comme Alta Vista, requièrent que l'opérateur NOT soit utilisé avec AND.

Exemple: Canterbury AND NOT Chaucer

L'opérateur NEAR est utilisé pour s'assurer que les deux mots-clés sont proches l'un de l'autre, à l'intérieur d'un groupe de 10 mots.

Exemple: Canterbury NEAR Chaucer

Parenthèses ( ) Les parenthèses peuvent être utilisées pour grouper des mots-clés en utilisant les opérateurs booléens afin d'effectuer une recherche encore plus précise.

Exemple: Chaucer OR (conte AND Canterbury).

 

Didactique des mots-clés pour le professeur de français

1. Faire comprendre la différence de notion

Il est important que le professeur de français fasse comprendre aux élèves que le mot-clé en informatique est synonyme de " forme de mot ", alors que partout ailleurs, il est synonyme de " sens global ".

2. Initier à la syntaxe booléenne

Le professeur de français peut aussi prendre le temps d'enseigner les rudiments de la syntaxe booléenne à l'occasion de recherches menées par ses élèves sur le web. Pour cela, il peut faire chercher quelle séquence de mots-clés unis par les booléens adéquats donne les meilleurs résultats. Il faudrait aussi examiner toutes les conséquences possibles de l'utilisation d'un mot-clé.
  1. Quelle séquence de mots-clés donnera les meilleurs résultats pour trouver des renseignements sur la place de la femme dans la société antique ?
  2. Comment faire pour trouver des renseignements sur les coccinelles sans se retrouver chez Volkswagen ?
  3. Si j'utilise comme mots-clés chanson de Roland , quels sont les résultats prévisibles ? Comment transformer la séquence pour qu'elle fournisse des renseignements sur l'œuvre littéraire, et rien de plus?
  4. Pour le cours de psychologie, je voudrais trouver des renseignements sur l'enfant et le jeu... sans arriver sur les sites des producteurs de jeux vidéo ou informatiques.
  5. Pour le cours de français, je cherche des renseignements sur le roman Le Parfum de P Süskind : que dois-je faire ?
  6. Il existe un logiciel qui s'appelle Nestor. Il s'agit d'un logiciel d'aide à la navigation web. Je voudrais des renseignements à ce sujet. Comment faire ?
  7. Trouver les horaires de train pour Bruxelles?
  8. Je voudrais trouver une carte détaillée de l'Irlande...
  9. Joachim RIEDL a-t-il écrit un livre sur Vienne ? Quel est son titre ?

Kartoo, un moteur qui fournit les mots-clés!

Un nouveau métamoteur de recherche vient d'être mis en ligne : Kartoo.

Il s'agit d'un méta-moteur qui s'appuie sur une série de moteurs de recherches réputés pour leur efficacité.

L'originalité concerne la manière dont les résultats s'affichent : ils sont intégrés dans une carte thématique qui met en évidence des mots-clés possibles communs aux sites trouvés! On peut alors forcer leur intégration dans la chaîne recherchée (AND) ou au contraire les exclure de la chaîne (NOT)

Ce moteur de recherche est intéressant, car il fonctionne à l'inverse des autres : il propose des mots-clés possibles. Reste à savoir combien de temps cette etchnologie restera gratuite...

Il est utile de cionsulter l'aide avant la première utilisation : pour cela, cliquez sur la lampe magique!

Sitographie

Recherche sur le web : le mot clé [en ligne] (article consulté le 29 janvier 2002)
Par un spécialiste de la bibliothéconomie, une série de considérations sur la difficulté de trouver le mot-clé adéquat pour découvrir à coup sûr et du premier coup ce qui est cherché.

La recherche intelligente sur Internet [en ligne] (article consulté le 27/01/2000)
La quantité d'informations en ligne sur le réseau Internet a tant augmenté que les outils actuels de recherche manquent d'efficacité. Il est donc nécessaire de rendre les moteurs de recherche capables de tenir compte de la sémantique... Des informations sur les orientations futures des moteurs de recherche.

Panorama et perspectives des outils de recherche d’Information textuelle sur Internet [en ligne] (article consulté le 15/01/2000)
Le développement récent et explosif du World-Wide Web a relancé les travaux sur les outils de recherche d’information textuelle, devenus rapidement indispensables à la navigation sur Internet. Ce papier se propose de faire un tour d’horizon de l’état de l’art des moteurs de recherche sur Internet et de discuter des pistes possibles pour leur évolution.

Description du fonctionnement des principaux moteurs de recherche. [en ligne] (article consulté le 27/01/2000)

Chercher pour trouver [en ligne] (pages consultées le 17/01/2001) Une démarche de recherche très systématique, élaborée dans un but pédagogique. On y apprend entre autres à mener une démarche rigoureuse d'exploration d'un domaine, en vue d'élaborer une liste de mots-clés à exploiter avec un moteur de recherches.


F. BERTEN, professeur de français à l'Institut Saint-Joseph, à Saint-Hubert,
Membre de la
Commission "Français et Informatique " (FESeC)
fernand.berten@planetinternet.be
http://users.skynet.be/ameurant/francinfo