Classement des résultats de recherche Confluence


Publié par
Alexandre ALQUIER

7 décembre 2010

Pour certains, le moteur de recherche Confluence est un outil surpuissant, voir indispensable.
Pour d’autres, c’est un sujet de contrariété récurrent car ils n’y trouvent jamais ce qu’ils cherchent.
Mais au fait, comment fonctionne-t-il ?
Nous allons tenter de comprendre son fonctionnement pour apprendre à mieux l’utiliser, et surtout mieux utiliser Confluence pour améliorer son efficacité.

Philosophie du moteur de recherche

Confluence accorde la plus haute priorité aux informations relatives aux personnes, c’est-à-dire aux documents qui renvoient aux profils des utilisateurs.
La collaboration est une fonction essentielle d’un wiki, c’est pourquoi Confluence permet de trouver facilement les contributeurs.

Par exemple, si vous cherchez « John Smith », les premiers résultats seront relatifs à l’utilisateur John Smith s’il existe (son profil, son espace personnel). Même si le terme apparaît dans des titres de contenus, ou y apparaît plusieurs fois, ces contenus apparaîtront toujours en dessous dans les résultats de recherche.

Viennent ensuite les contenus dans lesquels les termes recherchés sont présents dans le titre, et ceux dont l’une des étiquettes correspond aux termes recherchés. En effet, si quelqu’un a apposé ce label à son contenu, c’est qu’il considère que ce document est particulièrement pertinent sur ce sujet.

Le reste des résultats est composé des contenus dans le corps desquels les mots clés de recherche apparaissent, classés selon le nombre d’occurrences.

Enfin, on suppose que les informations créées récemment sont plus pertinentes que des informations plus anciennes.

Système de pondération des contenus

L’affichage des résultats de la recherche dépend d’un système de pondération appliqué à chaque élément.

  1. Confluence applique d’abord trois pondérations selon la méthode suivante :
    1. Type de contenu : profil utilisateur, page, message de blog, pièce-jointes, email, etc.
    2. Endroit où les termes recherchés ont été trouvés : titre, nom des contributeurs, étiquette, corps de texte, etc.
    3. Fraicheur de l’information
  2. Confluence combine ensuite ces trois pondérations pour obtenir une unique pondération pour chaque élément.

L’élément avec la plus forte pondération apparaîtra en haut de des résultats de la recherche, viendront ensuite les autres éléments par pondération décroissante.

Pondération par type de contenu

Type de contenu Pondération
Profil utilisateur 9
Page 8
Blog-post 7
Pièce-jointe 6
Commentaire 5
Mail 0.5
Description d’espace 0.4

Pondération sur l’endroit du document où les termes de recherche ont été trouvés

Localisation Pondération
Titre 9
Nom de l’auteur /
du dernier contributeur
8
Etiquette 7
Corps de texte 5

Pondération sur la fraicheur de l’information

Date de création de l’élément Pondération
Aujourd’hui 1.5
Hier 1.3
Il y a moins d’une semaine 1.25
Il y a moins d’un mois 1.2
Il y a moins de 3 mois 1.15
Il y a moins de 6 mois 1.10
Il y a moins d’un an 1.05
Il y a plus d’un an 1

Exemple

Prenons l’exemple d’une recherche sur un terme quelconque.

Confluence a trouvé une correspondance dans le titre d’un email créé aujourd’hui :
Pondération sur le type de contenu (email) 0.5
Pondération sur la localisation du terme (titre) 9
Pondération sur la date de création (aujourd’hui) 1.5
Poids total 6.75
Confluence a également trouvé une correspondance dans le contenu d’un commentaire créé il y a trois semaines :
Pondération sur le type de contenu (commentaire) 5
Pondération sur la localisation du terme (corps de texte) 5
Pondération sur la date de création (il y a moins d’un mois) 1.2
Poids total 30
Résultat :

Le commentaire, qui obtient un poids de 30 dans le moteur de recherche, apparaîtra plus haut que l’email dont le poids n’est que de 6.75.

Du bon usage des étiquettes

Bien souvent, les contributeurs ne perçoivent pas bien l’intérêt de l’utilisation des étiquettes.
Pourtant, leur pondération dans le moteur de recherche est plus importante que le contenu des éléments.

Les étiquettes sont notamment utiles pour :

  • Regrouper des pages sans avoir à restructurer l’arborescence des pages (en utilisant des macros)
  • Filtrer les informations dans une recherche

Références