
Assistants de programmation pour les développeurs, agents conversationnels pour la rédaction, copilotes intégrés à la bureautique : les outils d’IA générative ont investi les postes de travail. Mais que deviennent réellement les données qu’on leur confie ?
Le « shadow IA », nouvel avatar du « shadow IT »
Les directions des systèmes d’information se souviennent du shadow IT — ces logiciels installés hors de tout contrôle, créant des îlots de données non gouvernés. L’IA générative rejoue ce scénario, à une échelle et une vitesse sans précédent.
Les chiffres convergent. Selon IBM, l’adoption des applications d’IA générative par les salariés est passée de 74 % à 96 % entre 2023 et 2024. Une enquête de CybSafe et de la National Cybersecurity Alliance, conduite fin 2024 auprès d’environ 7 000 personnes, établit que 38 % des employés partagent des informations confidentielles avec des outils d’IA sans approbation de leur hiérarchie. Surtout, l’écart entre l’usage et l’encadrement est béant : un sondage ISACA de 2024 indique que 70 % des organisations observent l’usage d’IA générative par leurs équipes, mais que 15 % seulement disposent d’un cadre de gouvernance formalisé.
L’exemple le plus emblématique reste celui de Samsung. En 2023, le groupe a interdit l’usage interne de ChatGPT après avoir constaté, en moins de vingt jours, trois fuites distinctes — dont la transmission de code source propriétaire relatif à ses procédés de fabrication de semi-conducteurs, collé dans l’outil par des ingénieurs en quête d’aide au débogage.
Le mythe du « ce qui est partagé reste privé »
Deux incidents survenus en 2025 ont rappelé qu’une donnée confiée à un outil d’IA échappe largement à son auteur. À l’été 2025, des milliers de conversations ChatGPT que les utilisateurs avaient « partagées » se sont retrouvées indexées par les moteurs de recherche, et donc accessibles à tous : une option « rendre ce contenu visible », mal comprise, suffisait. On y a trouvé des révélations sur la santé mentale, des évaluations de candidats, du code propriétaire. OpenAI a désactivé la fonctionnalité en août 2025. À l’automne, des extraits de conversations ont par ailleurs commencé à apparaître dans la Search Console de Google, comme l’a documenté le consultant Jason Packer.
À distinguer — Le chiffre de « 100 000 prompts publiés » parfois cité renvoie en réalité à une affaire de 2023 (vol d’identifiants ChatGPT par des logiciels voleurs de données). Les incidents de 2025 décrits ici sont distincts — et plus instructifs sur la confusion entre
« partager » et « rendre public ».
Et au fond, que font-ils vraiment de nos données ?
Les fournisseurs déroulent de belles promesses : « vos données ne servent pas à l’entraînement », « vos conversations sont privées ». Il serait imprudent de les prendre pour argent comptant. Non que ces engagements soient nécessairement de mauvaise foi, mais ils sont bornés par des réalités qui leur échappent : une injonction judiciaire, un changement de politique, une opération de fusion-acquisition, une faille. L’affaire OpenAI contre le New York Times en offre l’illustration la plus nette. En mai 2025, un juge fédéral a ordonné à OpenAI de conserver l’intégralité des journaux de ChatGPT — y compris les conversations que les utilisateurs pensaient avoir supprimées. Le directeur des opérations de l’entreprise a reconnu publiquement que l’ordonnance « entrait fondamentalement en conflit » avec ses engagements de confidentialité. En novembre 2025, la justice a ordonné la production de vingt millions de conversations anonymisées aux parties adverses.
La leçon n’est pas qu’il faille bannir ces outils, mais qu’aucune promesse contractuelle n’efface le fait qu’une donnée transmise sort de votre contrôle. La formule du secteur est, au fond, toujours la même : « nous supprimons, sauf quand la loi nous l’interdit. » À noter, dans cette affaire, que les offres entreprise à rétention zéro échappaient à l’ordonnance — ce qui confirme que le niveau de service souscrit détermine très concrètement le niveau d’exposition.
Trois catégories d’outils, trois niveaux de garantie
Les offres grand public exploitent fréquemment les conversations pour améliorer leurs modèles ; une option de retrait existe souvent, mais demeure peu connue. Les offres entreprise apportent des garanties contractuelles : non-utilisation des données pour l’entraînement, confinement au périmètre de l’organisation, accord de traitement conforme au RGPD. Les modèles auto-hébergés, enfin, offrent le contrôle maximal — aucune donnée ne quitte le périmètre maîtrisé — au prix d’une infrastructure et d’une expertise significatives.
Les questions à poser à tout fournisseur d’IA
- Mes données sont-elles utilisées pour entraîner vos modèles ?
- Où sont-elles stockées et traitées géographiquement ?
- Qui peut y accéder, et dans quelles conditions ? Que se passe-t-il en cas d’injonction judiciaire ?
- Quelle est votre politique en cas de violation de données ?
- Pouvez-vous signer un accord de traitement conforme au RGPD, voire une rétention zéro ?
Construire une politique d’entreprise : les cinq piliers
Face à ces risques, l’improvisation n’est pas une stratégie. Les organisations les plus avancées ont formalisé une politique, même imparfaite, plutôt que d’attendre une solution idéale.
- Cartographier les usages existants : quels outils, par qui, pour quoi, avec quelles données. On ne gouverne pas ce que l’on ne connaît pas.
- Qualifier les outils autorisés : une liste blanche, assortie du niveau de sensibilité des données admissibles.
- Sensibiliser les collaborateurs : la meilleure politique reste lettre morte si les équipes ignorent ce qu’elles peuvent, ou non, partager.
- Contrôler techniquement : prévention de la fuite de données (DLP), serveurs mandataires, contrôles d’accès — en complément des politiques, jamais en substitution.
- Réviser régulièrement : le paysage des outils évolue en semaines ; la politique doit être un document vivant.
Notre recommandation — Commencez par l’audit des usages réels avant de rédiger la moindre règle. Interdire sans comprendre les besoins ne fait qu’alimenter un shadow IA supplémentaire. Mieux vaut canaliser intelligemment qu’interdire en vain.