Nuage de mots clés

Le « nuage de mots clés » (en anglais, “Tag Cloud”) permet de naviguer vers des pages dont la sémantique est identique, au lieu de naviguer selon l'ordre du sommaire. Les mots sont classés en ordre alphabétique, mais plus le mot est pertinent, plus il est mis en évidence. Vous pouvez cliquer sur un des liens pour atteindre des pages similaires.

J'ai découvert ce moyen de navigation sur des blogs, et j'ai vraiment apprécié ce concept. Je me suis dit lors d'une de mes nuits blanches que ce serait amusant d'en coder un pour l'infobrol. Voilà qui est fait...

Comment générer un nuage de mots clés (tagcloud) ?

Comme les indexations automatiques de mots clés en fonction du contenu ne produisent le plus souvent que des classement quantitatifs et non qualitatifs, j'ai tenté de mélanger les deux procédés :

  • Dans un premier temps, une analyse quantitative selon une taille minimum des mots, la fréquence de répétition au sein de la page, et la position des mots (par exemple au sein de balises de titres) permet une sélection de certains mots clés.
  • A ces mots sont ajoutés ceux qui proviennent de l'indexation de l'ancien moteur de recherche que j'avais créé il y a quelques années si ils ne sont pas déjà présents. Ces mots sont le résultat d'un algorithme qui tente de réduire les mots au singulier, sans accents, et avec le remplacement de certains caractères).
  • Quand je trouve un peu de temps, je peux effectuer une indexation manuelle. C'est à dire que j'ajoute des mots clés en fonction de leur pertinence, indépendament de toute logique quantitative. Nous avons donc pour ces pages un classement qualitatif. Ces mots clés ont la priorité sur les mêmes mots clés automatiques, et ils n'apparaissent donc qu'une seule fois.
    Bien entendu, une interface d'administration me soumet les mots clés ainsi qu'une proposition de niveau de pertinence, et il me suffit de valider ce que je considère comme correct, et de modifier ou de ne pas ajouter le reste (on est feignant ou on ne l'est pas).

Affichage du nuage de mots clés, les CSS

Un problème est immédiatement apparu : comme la majorité des pages ne sont pas encore indexées manuellement, tous les mots sont de même niveau, et l'aspect du nuage de mots clés est trop uniforme. Donc, le style général (police de caractère, taille de police, etc.) est défini par niveau, mais lorsque des éléments de même niveau se suivent dans le nuage de mots clés, la couleur est modifiée.

Résultats du nuage de mots clés

Lorsque le visiteur clique sur un des liens du nuage de mots clés, une page lui présente les résultats, selon un classement de pertinence. Si une définition est trouvée dans le dictionnaire de l'infobrol, la définition est affichée en premier lieu.

Les niveaux de mots clés

Pour illustrer les différents niveaux de mots clés, je fais appel sur cette page à un générateur de personnages célèbres que j'avais mis en place pour générer automatiquement des exemples de codes HTML, ou d'autres pages qui nécessitent des exemples.
A chaque chargement de page, les personnes sont donc différentes.

Niveau 1

Une expression très importante. Il s'agit d'une des notions principales de la page.

Exemples :

Niveau 2

Une expression importante fortement liée au sujet principal de la page.

Exemples :

Niveau 3

Chapitre, section, permet de trouver les pages qui évoquent d'autres notions, mais qui sont rassemblées au niveau de la navigation.

Exemples :

Niveau 4

Une expression d'importance moyenne

Exemples :

Niveau 5

Une expression de faible importance, mais en rapport direct avec les notions évoquées sur la page.

Exemples :

Niveau 6

Une note, une traduction, un accronyme.

Exemples :

Niveau 7

Une référence vers un document consulté lors de la conception de la page, un complément d'information externe.

Exemples :

Niveau 8

Une expression rencontrée dans la page, mais sans rapport direct avec le sujet principal de la page. Il s'agit d'une référence vers des pages plus spécifiques pour un complément d'information.

Exemples :

Niveau 9

Une expression codée, sans accents, au singulier, le plus souvent résultat d'une indexation automatique.

Exemples :

Niveau 10

Une expression rencontrée dans une page au contenu dynamique.

Exemples :

Niveau 11

Une expression indexée automatiquement, qui permet un "lien sortant" (lien vers d'autres pages, mais qui ne figurera pas dans la table des résultats).

Exemples :

 

Document créé le 13/03/10 03:52, dernière modification le 10/06/17 07:36
Source du document imprimé : //tagcloud.html

L'infobrol est un site personnel dont le contenu n'engage que moi. Le texte est mis à disposition sous licence CreativeCommons(BY-NC-SA). Plus d'info sur les conditions d'utilisation et sur l'auteur.

Notes

  1.  nuage de mots clés : correspond à “Tag Cloud » en anglais