Qu’est-ce que ? : Classification automatique des documents

30 avril 2008

dans Concepts

Troisième note de la rubrique ‘concepts‘ dédiée cette fois à la présentation de la classification automatique des contenus.

L’utilisation d’un référentiel documentaire (GED, ECM) offre un ensemble de fonctionnalités de prise en compte, stockage et restitution des documents et contenus. La classification de ces informations est un point critique, à ne pas négliger, car on se doute facilement que quel que soit l’importance d’un document, s’il est mal référencé il sera difficile voire impossible à retrouver. Il va donc falloir mettre en oeuvre des procédures de qualification complexes fonctions de la nature des documents.

Pour pallier à cela, les systèmes d’ECM proposent désormais un module de Classification automatique qui va permettre de rendre aisée l’opération de caractérisation des contenus. Parmi les fonctionnalités couvertes par la plupart des outils :

  • organiser et tagger les documents en provenance de sources disparates
  • appliquer un modèle de classement structuré commun
  • améliorer l’accessibilité et la réutilisation des documents
  • optimiser la déclaration des Records (au sens Records Management) le cas échéant
  • accélérer le processus de classement
  • améliorer les résultats

Grâce aux fonctionnalités offertes par ce type de modules, on va pouvoir aisément tirer profit des contenus textuels des documents pour en assurer le classement (sur le mode analytique), à l’aide de fonctionnalités de type ‘recherche plein texte’ par exemple, ce qui s’avère généralement plus pertinent que le classement à base de règles métiers tel qu’on le connait traditionnellement (par exemple si le titre contient #xxF01 alors classer dans dossier ‘contrats’ + ‘France’ + ‘Janvier’).

Au contraire du classement à base de règles, le classement automatique propose un mode apprentissage (assez similaire dans l’esprit à ce que propose les modules de LAD/RAD) permettant d’optimiser le taux de classement au fil du temps.

Tout comme les services de type « Basic Content Services« , la classification automatique des documents est un moyen de favoriser l’adoption par les utilisateurs du référentiel ECM, leur permettant ainsi de stocker leurs documents sans nécessairement les classifier manuellement (gain de temps) et connaître le plan de classement à respecter (gain en qualité).

Lire la suite :

Les commentaires sont fermés sur cette entrée.

Article précédent :

Article suivant :