Au printemps 2024, la société PMB Services a annoncé avoir fait des tests significatifs pour intégrer l’IA conversationnelle dans son logiciel de gestion documentaire.
Cette annonce s’est faite en deux temps, un premier temps au salon Documation de mars 2024 et un deuxième temps lors d’un webinaire le 17 mai 2024.

Ci-dessous quelques éléments retenus du webinaire du 17 mai 2024.

Le principe

En exploitant les données qualifiées des bases documentaires, il est désormais possible de poser une question en langage naturel dont le sens est compris par l’IA, qui restitue les documents pertinents ainsi qu’une synthèse écrite des informations utiles (texte PMB Service)

Le test

Un test a été mené sur base ASOCDOCPSY, base d’environ 120 000 documents sur la santé psy.

Seuls les résumés et les titres des notices sont analysés – et pas les contenus des documents numériques (qui peuvent poser des problèmes de droits d’accès).

A chaque question on obtient une liste de documents pertinents et une réponse synthétique.

Les avantages

Si la base est correctement qualifiée, les réponses sont sûres. Ceci dit, l’IA ne remplace pas le travail des documentalistes car sans sélection par les documentalistes et sans analyse, l’IA ne sert à rien.

Le modèle est multilingue et paramétrable en fonction des besoins des utilisateurs.

Les facettes servent à affiner la réponse.

Les sessions de questions sont sauvegardées. Ce n’est pas une discussion mais une recherche question par question.
Il est possible de partager les résultats d’une recherche en copiant le lien de la recherche.

Le fonctionnement est basé un RAG qui interroge la base documentaire de l’utilisateur et qui formule des réponses en citant les sources utilisées.

Un prompt détaillé est joué à chaque question. Dans ce prompt on demande notamment à l’IA de ne pas inventer si elle ne trouve pas de réponse.

Prompt PMB

Les limites

Le risque d’hallucination est faible car la réponse est bâtie sur les résumés des notices. Le seuil de pertinence peut se régler (dans les paramètres).

Il est aussi possible de faire une demande de reformulation – un prompt spécifique existe pour cela.

Les sigles sont mal pris en compte.

La technologie

PMB a développé son propre serveur IA modèle MISTRAL 7B, rien n’est transmis aux USA. Bases de données et questions sont stockées sur les serveurs PMB (bien pratique si votre base est également hébergée chez eux).

Les perspectives d’amélioration

Déjà beaucoup d’idées pour faire évoluer l’outil, notamment une idée de recherche d’après les couvertures que j’ai trouvé très amusante (pas forcément adaptée dans le cadre de mon Service Documentation mais pratique pour la lecture publique et pratique d’une manière générale pour ma vie de lectrice en bibliothèque publique).

Idées de paramétrages : sources externes, veilles, alertes

Idées d’utilisation des capacités de l’IA générative

  • Synthèse des points importants dans une DSI,
  • Pré-catalogage automatique,
  • Traduction automatique,
  • Génération d’articles de portails ou d’images d’illustration.

Bonne nouvelle : PMB Services, en société responsable, réfléchit à son impact sur l’environnement.

En effet, entraîner les modèles demande beaucoup d’énergie. L’idée est donc de créer des modèles par domaine (thématique) afin de mutualiser les dépenses énergétiques.

Quid de la mise en route ?

Ce programme sera possible avec la version 8 de PMB (en cours).

Le surcoût comprendra l’apprentissage du modèle, son paramétrage, l’implémentation dans PMB (côté admin et portail) + coût récurrent du serveur IA mobilisé. Un coût annuel ou forfait à la requête (à l’étude). Possibilité également se brancher sur une IA déjà installée dans une structure.

En conclusion

Pour ce webinaire, plus de 400 inscrits avec un engouement des auditeurs hors du commun.

L’avalanche de questions et de préoccupations qui relevaient déjà de stratégies d’implantation, témoigne de l’attente des clients pour faire évoluer leur catalogue.

Sur beaucoup de questions techniques, Bérengère a souvent répondu « c’est paramétrable », ce qui est bien rassurant. De son côté, Florent ne manque pas d’idées pour faire évoluer le modèle, certaines présentées en piste d’évolution sont déjà en cours de réalisation.

L’autre point rassurant c’est le rôle du documentaliste qui reprend tout son sens dans la qualification des données. Car sans donnée qualifiée, l’intelligence artificielle ne sert à rien. Ces innovations sont d’ailleurs une superbe motivation pour continuer à enrichir son catalogue de manière « propre » et efficace. Parfois, face à l’avalanche de tâches d’une journée de documentaliste, on pourrait être tenté de simplifier à l’extrême la saisie des notices. Via l’IA générative, certains champs, parfois laborieusement alimentés en allant à la pêche aux infos, vont jouer un rôle crucial dans l’amélioration de la recherche et l’optimisation du catalogue. On ne peut que s’en réjouir.


Revoir le webinaire : https://webikeo.fr/webinar/l-intelligence-artificielle-appliquee-a-la-recherche-documentaire/

Merci à l’équipe PMB et tout particulièrement Bérengère Royer, Responsable commerciale PMB SERVICES et Florent TETART, Responsable de l’innovation PMB SERVICES qui ont su faire preuve d’une grande agilité menant de front présentation riche en contenu et questions multiples des auditeurs.

Publié le 21/05/2024, modifié le 22 mai 2024