Quelle évolution pour les moteurs de recherche dans les référentiels documentaires ?

18 septembre 2009

dans ECM

search_engine

Illustration (C) Danard Vincente

De même que les plateformes ECM et BPM, les outils de recherche évoluent. Fût un temps où disposer d’un moteur de recherche plein texte couplé à des capacités de recherches sur attributs permettait de satisfaire nos utilisateurs (cf. la précédente note sur le sujet) mais les temps changent et les besoins évoqués par les gens du métier diffèrent.

Comment recherche-t-on au sein d’un référentiel documentaire, de façon classique ?

Le but initial de la recherche est de retrouver un document au sein du catalogue, tout comme on le ferait si ce même document était stocké sur son ordinateur personnel. Pour ce faire, les outils de GED proposaient au début de leur apparition des capacités de recherche sur attributs. Chaque document se voyant adjoindre une fiche d’indexation (ou fiche de propriétés), il suffisait en effet d’interroger la base de données associée pour retrouver la liste des documents correspondants, la possibilité d’affiner la recherche à partir d’une première liste de résultats était un moyen efficace de retrouver LE document concerné. Exemple d’une telle requête : retrouver tous les documents dont la propriété ‘type de document’ est égale à ‘contrat’ et dont la valeur du champ ‘client’ est égale à ‘xyz’.

Le modèle d’indexation associé au référentiel devait alors être très pertinent car sans propriétés personnalisées bien pensées il était difficile d’arriver à ses fins.

L’arrivée des documents d’origine électronique dans les référentiels – par opposition aux documents dits statiques ou images de documents papier dématérialisés – a permis d’élargir le spectre fonctionnel en matière de recherche. En effet il devenait possible, à l’aide d’un moteur de recherche plein texte, de retrouver un document non plus à partir de ses propriétés mais à partir de son contenu propre. Exemple d’une telle requête : retrouver tous les documents contenant le mot ‘contrat’ et le mot ‘xyz’.

Ces deux types de recherches pouvant être combinées, l’utilisateur pouvait à loisir rechercher ses documents sur la base des propriétés ET du contenu. C’est la recherche combinée que nous utilisons encore beaucoup de nos jours.

Quand le XXIème siècle passe par là et la crise financière aussi.

Depuis quelques années déjà les moteurs de recherche évoluent, Google en est un bon exemple, et les fonctionnalités associées ne cessent elles-aussi d’évoluer pour offrir aux utilisateurs des algorithmes toujours plus complets, complexes et efficaces. Néanmoins ces outils restent avant tout des outils techniques mis à disposition d’utilisateurs métiers. Et ces derniers ont aujourd’hui des besoins nouveaux, liés à l’évolution du monde industriel et à la nécessaire adaptation à l’environnement économique en perpétuelle évolution. Désormais il ne s’agit plus de retrouver un document parmi un grand nombre, les intéressés n’ont généralement plus le temps de trier les listes de résultats, de s’assurer que le document recherché est bien celui qui contient la bonne information, que le contenu ainsi récupéré va répondre à leur problématique. Ils réclament des outils plus contextuels, qui ne leur présentent plus une liste de résultats brute mais une réponse à leur problème. L’approche est différente et l’évolution des outils informatiques nécessaire.

Les outils de recherche qui font leur apparition depuis quelques mois déjà offrent donc maintenant des fonctionnalités correspondant à ces besoins : on recherche un contexte plus qu’un document, l’outil va donc présenter tous les contenus correspondants à ce contexte. La nécessaire obligation pour les entreprises de se mettre en conformité avec les normes et réglementations en vigueur offre de bons exemples pour illustrer ce propos. Dans le cadre d’une procédure d’audit de conformité, plutôt que de rechercher tous les documents qui traitent d’une affaire donnée, l’auditeur réclamera toutes les informations relatives à l’affaire, pour une période de temps donnée, qu’il s’agisse de correspondances directement liées à l’affaire, comme de contenus pouvant être très indirectement en rapport. Un email considéré comme non pertinent à priori pourra ainsi se révéler porteur d’une information contextuelle particulière qui pourra venir alimenter le dossier d’audit. Des règles complexes de recherche et de rapprochement des contenus entre eux vont permettre de constituer des « dossiers de recherches » – par opposition aux listes de résultats – et de présenter et  mettre en forme les informations ainsi récoltées afin que celui qui aura la responsabilité de les analyser puisse le faire sans autre forme de traitement manuel.

Ces outils viennent petit à petit supplanter les modes de recherche plus traditionnels, et il y a fort à parier qu’ils les remplaceront dans un avenir proche. Il suffit de regarder comment sont classés et catégorisés les documents dans un référentiel désormais pour constater que très souvent les propriétés personnalisées ne sont plus utilisées, que les contenus sont taggués plutôt que triés, que les arborescences de répertoire de classement disparaissent au profit des vues dynamiques, etc.

L’avenir des moteurs de recherche traditionnels est compromis, de nouveaux outils font leur apparition, correspondant à de nouvelles pratiques, et ce domaine est probablement celui qui va subir les évolutions les plus importantes dans les années à venir. Gageons que nous retrouverons là de quoi lancer quelques nouveaux débats, mais une chose est sûre, il reste beaucoup à dire dans ce domaine.

Lire la suite :

Les commentaires sont fermés sur cette entrée.

Article précédent :

Article suivant :