Retour sur le webinaire Horti’doc du 18 novembre 2025
Le 18 novembre 2025, le réseau Horti’doc organisait un webinaire intitulé « Un thésaurus a-t-il encore du sens dans un monde d’IA ? ». Plus de 140 participants, dont près de 80 % de professionnels de l’information-documentation, ont assisté à cet événement qui posait une question centrale pour notre métier : face à la montée en puissance de l’intelligence artificielle générative, les outils documentaires traditionnels ont-ils encore leur place ?
En tant que documentaliste juridique, cette question résonne fortement. Nos fonds documentaires reposent sur des langages contrôlés, des plans de classement, des thésaurus. Autant d’outils qui structurent l’accès à l’information et garantissent la fiabilité des recherches. Voici ce que j’en retiens.
Rappel des notions : du vocabulaire d’autorité au thésaurus
Le webinaire a opportunément remis à plat les fondamentaux. Un vocabulaire d’autorité est une liste fermée de termes normalisés. Un langage contrôlé va plus loin en organisant ces termes selon des règles d’utilisation. Le thésaurus, quant à lui, est un langage documentaire structuré qui hiérarchise les concepts et explicite les relations entre eux (termes génériques, spécifiques, associés). L’ontologie et le web sémantique ajoutent une couche formelle supplémentaire, permettant aux machines de raisonner sur les données.
L’INRAE dispose d’un thésaurus de référence couvrant ses domaines de recherche : plus de 16 000 concepts en français et en anglais, avec plus de 1 200 définitions, consultable librement via le portail Vocabulaires Ouverts.
Ce que l’IA peut apporter aux langages documentaires
Les intervenants ont montré que l’IA n’est pas l’ennemie du thésaurus. Elle en est un allié potentiel. Les grands modèles de langage (LLM) sont particulièrement performants pour catégoriser des contenus, ce qui ouvre plusieurs pistes concrètes d’utilisation.
Mettre à jour un thésaurus ou un plan de classement. L’IA peut identifier de nouvelles thématiques émergentes dans un corpus et suggérer des enrichissements. La méthode recommandée est simple : exporter son thésaurus au format PDF (les LLM analysent mieux ce format), puis demander à l’IA de proposer des mises à jour ou des ajouts de termes.
Vérifier la cohérence d’un langage documentaire. L’IA peut repérer des incohérences structurelles, des doublons conceptuels ou des lacunes dans la couverture thématique d’un thésaurus. C’est un outil de contrôle qualité appréciable, surtout pour des référentiels volumineux.
Enrichir l’indexation. L’enrichissement automatique de notices via l’IA peut compléter l’indexation manuelle. Les LLM peuvent proposer des descripteurs pertinents à partir de l’analyse du contenu d’un document, ce qui accélère le traitement des flux entrants.
L’IA générative peut-elle remplacer l’indexation ?
C’est la question qui fâche, et la réponse du webinaire est nuancée : non, pas en l’état.
L’IA générative offre des réponses immédiates et peut en proposer d’autres si la première ne convient pas. Mais elle présente des limites significatives pour un usage documentaire rigoureux. Les réponses peuvent varier d’une interrogation à l’autre pour une même question, ce qui pose un problème de reproductibilité. Elles ne sont pas toujours vérifiables, ce qui est rédhibitoire dans un contexte où la traçabilité de l’information est essentielle.
À l’inverse, le thésaurus présente des avantages irremplaçables. Il documente de manière transparente et pérenne un fonds documentaire. Un langage structuré produit des tags homogènes, garantissant la cohérence de l’indexation dans le temps. Le thésaurus assure la fiabilité lexicale des données : c’est un socle stable sur lequel l’IA peut ensuite s’appuyer pour déployer sa puissance de calcul.
En d’autres termes, le thésaurus apporte la rigueur et la transparence ; l’IA apporte la puissance et la rapidité. Les deux sont complémentaires.
Ce que cela signifie pour la documentation juridique
Pour les documentalistes juridiques, les enseignements de ce webinaire sont directement transposables. Nos plans de classements (qu’ils portent sur les branches du droit ou la gestion des connaissances) restent indispensables pour garantir la précision et la constance de l’indexation.
L’IA, en revanche, peut nous aider à maintenir ces outils à jour face à l’évolution permanente du droit, à accélérer l’indexation des flux documentaires croissants et à améliorer l’expérience de recherche des utilisateurs en suggérant des termes ou en élargissant automatiquement les requêtes.
Le webinaire Horti’doc confirme une conviction que beaucoup de professionnels de l’info-doc partagent : l’IA ne rend pas les thésaurus obsolètes. Elle les rend au contraire plus nécessaires que jamais, comme socle de qualité et de confiance dans un environnement informationnel de plus en plus automatisé. Le véritable enjeu n’est pas de choisir entre l’un et l’autre, mais d’articuler intelligemment les deux.
Les supports de présentation du webinaire sont disponibles sur le site hortidoc.net.
Liens utiles
https://vocabulaires-ouverts.inrae.fr/
https://consultation.vocabulaires-ouverts.inrae.fr/thesaurus-inrae/fr/
les supports de présentation du webinaire organisé par Horti’doc le 18 novembre 2025 sur le thème du thésaurus et l’IA sont en ligne sur le site hortidoc.net.
https://www.hortidoc.net/actualites/retour-sur-le-webinaire-horti-doc-thesaurus-et-ia
Illustration : extrait de papier peint, salle Menphis du musée des arts décoratifs, samedi 28 mars 2026, photo personnelle
Publié le 30/03/2026, modifié le 30 mars 2026


