Introduction──le « lien » que l’IA m’a tendu

Un jour, j’ai demandé à une IA que nous utilisons au travail comment se servir d’un outil fourni par un certain éditeur. Ce n’est pas un OSS célèbre ni un outil commercial porté par une communauté dynamique ; on trouve certes quelques informations sur Internet, mais elles restent clairsemées.

L’IA m’a donné une solution parfaitement adaptée et, en prime, un lien présenté comme « référence ».

Le lien s’est ouvert sans problème. La page contenait bel et bien ce que je cherchais, mais le titre affichait ceci :

« Confidentiel – Ne pas diffuser en dehors de l’entreprise ».

Hein ? De quelle entreprise provenait ce document interne ? … En y regardant de plus près, ce n’était ni celui de ma société ni un manuel officiel du fournisseur, mais visiblement le guide interne d’une autre entreprise utilisant le même outil.

Chouette ?

Pas du tout. J’en ai eu des frissons.

On peut certes tomber sur cette page en ignorant l’IA et en lançant une recherche avec les bons mots-clés, mais seulement au bout de dizaines de pages de résultats. Autant dire qu’on ne l’aurait jamais trouvée en cherchant « à l’ancienne ».


Première partie : la « démocratisation » que l’IA apporte

Les moteurs de recherche à robots nous obligeaient à tamiser une montagne de sable pour dénicher des pépites. Les fournisseurs d’outils ont beau optimiser l’ordre des résultats, il y a une limite : les grands sites monopolisent le haut du classement et les informations cruciales publiées plus bas restent invisibles. À l’inverse, l’IA remet la pépite elle-même, même si elle provient d’un site relégué tout en bas, pourvu que la réponse corresponde à la question.

  • L’information qu’un humain mettrait des dizaines de minutes à trouver — ou à laquelle il aurait renoncé — apparaît instantanément si la requête correspond.
  • Des personnes qui n’avaient pas accès à un savoir expert peuvent désormais toucher la réponse d’un simple prompt.

C’est indéniablement la démocratisation de l’accès à l’information. Comme Internet en son temps, l’IA arrache le savoir au monopole des élites et des spécialistes pour l’ouvrir largement.

Dans l’éducation et la recherche, l’effet est spectaculaire. Ce qu’il fallait auparavant dénicher dans des ouvrages spécialisés ou des revues scientifiques, étudiants comme professionnels peuvent désormais l’obtenir instantanément depuis leur bureau. Une start-up peut élaborer une stratégie sans signer de contrats de conseil faramineux, un individu peut développer une application dans la nuit.

Il en va de même pour l’émission d’information. Internet a offert à chacun la possibilité de diffuser ses idées au monde entier, mais, en pratique, les voix peu connues restaient difficiles à découvrir.

Et pourtant, voilà ce qui s’est passé. L’IA a instantanément présenté une page avec un classement catastrophique dans les moteurs de recherche — probablement mise en ligne par erreur et sans la moindre optimisation SEO — uniquement parce qu’elle répondait exactement à ma question.

On peut dire que, pour quiconque en a besoin, la diffusion et l’accès à l’information ont été démocratisés à un niveau qu’Internet seul n’avait jamais atteint.


Deuxième partie : la « divulgation » qui se cache derrière la démocratisation

Mais cette expérience m’a appris que cette démocratisation est simultanément une machine à divulguer.

L’information de cette entreprise était accessible à cause d’une erreur de configuration. Certes, un moteur de recherche classique aurait pu l’indexer et un tiers aurait pu la consulter. Mais sans l’IA, personne ne s’en serait rendu compte, sauf hasard extraordinaire. Qui parcourt la vingtième page des résultats ?

Ce qui aurait dû rester dans la catégorie « Nous avons eu chaud mais personne ne l’a vu, donc tout va bien » est désormais transmis en un instant à celui qui en a besoin grâce à l’IA. Dans cet exemple, il ne s’agissait que d’un mode d’emploi (pas de quelque chose d’ultrasecret) et la demande n’avait rien de malveillant, donc il n’y a pas eu de préjudice… Mais que se passerait-il si l’information dévoilée par mégarde était sensible et recherchée par une personne mal intentionnée ? J’ai compris à cet instant que le secret de facto — parce que c’est trop difficile à trouver — n’existe plus à l’ère de l’IA.

« C’est enfoui donc nous sommes sauvés » ne tient plus. Dès qu’une page est indexée, celui qui la cherche la reçoit très vite.

Bien sûr, les grands modèles comme ChatGPT intègrent des politiques et des filtres pour refuser les demandes malveillantes, et ces garde-fous continueront de se renforcer. Mais qu’en est-il d’une IA construite par un particulier sans aucune politique ?

Il fut un temps où les virus de type Winny ont secoué l’actualité. Des informations internes des Forces japonaises d’autodéfense, des listes de clients d’entreprises, des photos et vidéos privées ont fuité, créant une crise majeure. Certaines entreprises allaient jusqu’à demander à leurs employés de s’engager par écrit à ne pas utiliser Winny. ※ Winny n’était en soi qu’un outil de partage de fichiers en pair-à-pair, ce qui rendait cette situation paradoxale, mais de telles demandes existaient bel et bien.

Or la précision des réponses données par les IA génératives peut entraîner des conséquences bien plus graves. Une fois l’information laissée à découvert, elle tombe entre de mauvaises mains avec une rapidité sans commune mesure. Inutile de recourir à un virus : une seule erreur suffit.

L’IA fournit la « réponse » sans hésitation quand on l’interroge. Elle n’a ni éthique ni sens des responsabilités. ※ Les IA assorties de politiques « hésitent », certes, mais il est déjà possible pour un particulier de construire un modèle sans censure. On trouve par exemple des modèles sans filtrage sur Hugging Face.

À l’ère de l’IA, « c’est caché donc c’est sans danger » n’existe plus.

Pire encore, la divulgation ne se produit pas qu’une fois. Une fois apprise par l’IA, résumée puis réutilisée par d’autres utilisateurs, l’information connaît simultanément « diffusion et ancrage ». Il est possible qu’elle circule quasi indéfiniment par l’intermédiaire de l’IA avant même que quiconque ne remarque la fuite.


Troisième partie : l’asymétrie des vitesses

Ce qui aggrave le problème, c’est l’asymétrie des vitesses.

  • L’IA collecte, optimise et délivre l’information à une vitesse fulgurante ; sa capacité à la remettre à celui qui la désire n’a rien à voir avec la recherche classique.
  • Les lois, réglementations et cadres éthiques qu’érige la société — sans parler des contre-mesures et de la sensibilisation — n’évoluent qu’à l’échelle de l’année, même en allant vite.

Cette asymétrie amplifie la crainte.

La diffusion de l’information a connu plusieurs étapes : journaux, télévision, moteurs de recherche. Chacun imposait un certain frottement ou délai, laissant à la société le temps de mettre ses règles à jour. Mais l’IA réduit presque ce frottement à zéro et distribue instantanément la « meilleure réponse » au monde entier.

Résultat : le savoir exact, les rumeurs erronées, les informations dérangeantes — tout se propage au même rythme vers celui qui les réclame dès qu’elles sont apprises. Nous vivons déjà dans un futur où l’IA relate avec le même aplomb les travaux d’un expert, les intox anonymes des forums et une fuite tragique due à une erreur humaine.


Quatrième partie : qui porte la responsabilité ?

Dans cette histoire, j’ai cliqué sur le lien. Ce n’était pas un accès illégal : la page apparaissait dans les résultats et je n’ai franchi aucune authentification. Le problème, c’est que la décision « Ai-je le droit de regarder ? » a été laissée au seul jugement humain, ou, dit autrement, qu’aucun filtre ne s’est interposé pour décider « Peut-on montrer ceci ? ».

L’IA tend la réponse, mais ne se demande pas si elle doit la donner. Comme je le mentionnais dans un précédent article, l’IA n’a ni dignité, ni conviction, ni sens du devoir. Il ne reste donc qu’à l’humain de combler ce vide.

Par précaution, je suis remonté à la racine du site de cette entreprise et j’ai envoyé un message à l’adresse de contact. Sans me vanter, j’ai compensé l’irresponsabilité de l’IA par le sens des responsabilités, la conscience morale et la crainte humaine.

Le lecteur avisé le comprendra : rien ne garantit que tout le monde agira ainsi. Certains diffuseront l’information, d’autres feront sans le vouloir apprendre des données internes à une IA. À ma connaissance, cette affaire n’a pas encore fait scandale au même niveau que les virus de Winny, mais j’ai l’intuition que le sujet finira par émerger.


Conclusion──vers une « conception responsable » à l’ère de l’IA

L’IA démocratise l’accès comme la diffusion de l’information avec une puissance sans commune mesure avec la simple généralisation d’Internet. Mais l’envers du décor, ce sont des divulgations involontaires transmises « rapidement et exactement » à des acteurs mal intentionnés. La frayeur tient au fait qu’un « Nous avons laissé quelque chose ouvert par erreur mais personne ne l’a remarqué » ne tient plus ; désormais, « Dès que c’est indexé, c’est transmis rapidement et exactement à ceux qui en abusent » devient la norme.

Et parfois il n’y a même pas d’erreur de configuration : il suffit d’avoir jugé qu’une information pouvait être publique à un instant donné pour qu’en agrégeant tout ce qui est publié, on fasse apparaître un portrait inattendu de la personne concernée. J’ai fait l’expérience en demandant à ChatGPT de digérer tous les articles de ce blog : le modèle a analysé mon profil avec une précision ressentie d’environ 60 %. Bien sûr, il n’a pas trouvé mon employeur ni mon âge exact (il a seulement deviné une tranche), et il s’est trompé sur beaucoup de points, mais ce n’était pas complètement à côté. ※ Des travaux en stylométrie montrent qu’on peut identifier un auteur à partir de quelques dizaines de lignes.

Selon la cible, il arrivera parfois à un sans-faute. Même un ensemble d’informations en apparence anodines peut, une fois tout recoupé, révéler une réalité insoupçonnée. ※ L’OSINT (Open Source Intelligence, ou collecte et analyse d’informations ouvertes) devient plus puissant et plus simple ; n’importe qui peut l’utiliser contre n’importe qui — y compris, par exemple, un harceleur contre sa cible.

La problématique qui nous attend n’est pas un simple renforcement de la sécurité. Il nous faut penser des responsabilités et des dispositifs de sécurité adaptés à l’ère de l’IA — chercher des règles et des contre-mesures capables de suivre la vitesse à laquelle l’information est démocratisée.

Grâce à l’IA, le savoir n’a jamais été aussi accessible. Mais, dans le même temps, le mythe rassurant du « Si personne ne le trouve, c’est bon » s’est effondré. Je n’ai pas de réponse définitive aujourd’hui, mais une chose est sûre : maintenant que l’IA dissout les frontières de l’information, nous devons revoir notre approche de sa gestion.

Désormais, nous n’avons d’autre choix que de vivre en gardant à l’esprit les deux faces d’une même pièce : démocratisation et divulgation.