Essayez l'outil gratuitement

Essayer
Veille6 min de lecture

Québec confie à BAnQ la construction d'une banque publique de données pour entraîner l'IA

Le ministre Mathieu Lacombe a annoncé le 8 mai 2026 un mandat de 750 000 $ confié à Bibliothèque et Archives nationales du Québec pour bâtir, en 12 mois, le premier cadre de gouvernance fédérée d'une banque publique de données culturelles et gouvernementales destinée à entraîner des IA québécoises.

FB
Florian Brobst
Fondateur & Directeur · 12 mai 2026

Le 8 mai 2026, le ministre de la Culture et des Communications, Mathieu Lacombe, a annoncé un mandat de 750 000 $ confié à Bibliothèque et Archives nationales du Québec (BAnQ) pour piloter la prochaine phase du projet de Banque de données gouvernementales et culturelles en français et en langues autochtones. Au-delà du montant, modeste à l'échelle des budgets fédéraux d'infrastructure d'IA, l'annonce marque un basculement : pour la première fois, le Québec se dote d'un opérateur public dédié à la mise en commun et à la gouvernance des données nécessaires pour entraîner des modèles d'IA qui reflètent la langue, la culture et la réalité administrative québécoises.

Une réponse structurée à un problème de souveraineté

Depuis 2024, les avis de l'OBVIA, du Conseil de l'innovation et de plusieurs comités universitaires convergent vers un même constat : tant que les grands modèles d'IA seront entraînés sur des corpus majoritairement anglophones et issus de juridictions étrangères, le français québécois, les langues autochtones et la production culturelle locale resteront sous-représentés dans les sorties générées. Cette sous-représentation n'est pas seulement esthétique : elle a des effets concrets sur la qualité des traductions, sur la pertinence des assistants conversationnels déployés dans l'administration publique et sur la valeur économique générée par les contenus locaux lorsqu'ils servent, sans contrepartie, à entraîner des modèles commerciaux étrangers.

La Banque de données vise à corriger ce déséquilibre en créant un actif public structuré, traçable et juridiquement clair. L'idée n'est pas de centraliser physiquement toutes les données dans un seul entrepôt, mais d'articuler un écosystème fédéré où des partenaires (ministères, sociétés d'État, institutions culturelles, universités, communautés autochtones) restent propriétaires de leurs données tout en acceptant des règles communes d'accès, d'usage et de rétribution.

Ce que la phase 2026-2027 prévoit

Les 750 000 $ couvrent 12 mois d'expérimentation autour de trois livrables. Le premier est un cadre de gouvernance fédérée : qui décide quoi, selon quelles règles, et avec quels recours en cas de désaccord. C'est le coeur de l'exercice et probablement le plus difficile, car il faut concilier les exigences de la Loi 25, les obligations de la Loi sur les archives, les principes de souveraineté des données autochtones (CARE et OCAP) et les attentes des créateurs en matière de droits d'auteur.

Le deuxième livrable est une série de projets pilotes destinés à démontrer des cas d'usage concrets. La sélection finale n'est pas encore publique, mais les pistes évoquées dans l'étude de faisabilité d'octobre 2025 incluent l'entraînement de modèles de traduction adaptés au français québécois, le développement d'outils de découvrabilité culturelle et la mise à disposition de corpus pour la recherche universitaire en traitement automatique des langues.

Le troisième livrable est une feuille de route pluriannuelle, qui devra arbitrer entre plusieurs scénarios d'industrialisation : opérateur public unique, consortium hybride avec des partenaires privés, ou modèle distribué inspiré des infrastructures de recherche européennes. C'est cette feuille de route, attendue au printemps 2027, qui déterminera l'ampleur de l'engagement budgétaire suivant.

Le pari de l'IA frugale et locale

L'argumentaire ministériel s'appuie ouvertement sur le concept d'IA frugale, défendu notamment par Mila et l'OBVIA. L'idée : plutôt que de chercher à reproduire au Québec les modèles de mille milliards de paramètres entraînés par les hyperscalers américains, miser sur des modèles plus petits, spécialisés et entraînés sur des données de qualité, sélectionnées pour leur pertinence culturelle et linguistique. Cette approche réduit la facture énergétique, allège l'empreinte des centres de données et rend plus probable une appropriation par des PME québécoises qui n'ont ni les moyens ni les besoins d'un GPT généraliste.

Cette orientation est cohérente avec l'énoncé de politique sur la souveraineté numérique publié en mars 2026 et avec les investissements annoncés autour du superordinateur public canadien (SCIP). Là où Ottawa mise principalement sur la capacité de calcul, Québec semble vouloir investir dans la couche immédiatement supérieure : les données qui rendent ce calcul utile.

Trois zones de friction à surveiller

Le projet est défendable, mais il n'est pas exempt de risques. Le premier porte sur la rémunération des ayants droit. Verser des contenus culturels dans une banque destinée à entraîner des modèles d'IA exige des mécanismes contractuels nouveaux, distincts de la cession classique de droits. L'étude de faisabilité reconnaît qu'aucun modèle juridique standard n'existe encore, et la phase d'expérimentation devra produire des contrats types acceptables pour les sociétés de gestion collective et les créateurs indépendants.

Le deuxième risque concerne la souveraineté autochtone. Inscrire des langues et des contenus autochtones dans une banque pilotée par une institution publique provinciale soulève des questions de gouvernance qui ne se règlent pas par une simple consultation. La phase 2026 devra démontrer que les Premières Nations et les Inuits disposent d'un véritable pouvoir de décision, et pas seulement d'un siège consultatif, sur les corpus qui les concernent.

Le troisième risque est budgétaire. Un cadre de gouvernance fédérée est lent à construire, et la dotation initiale de 750 000 $ ne couvre que les fondations. Sans engagement pluriannuel clair, le projet risque de subir le sort de plusieurs initiatives québécoises antérieures en données ouvertes : un démarrage prometteur, une décélération discrète et un actif inachevé.

Pourquoi cette annonce compte pour les gouverneurs d'IA

Pour les comités de gouvernance d'IA des organisations québécoises, cette annonce a un effet pratique immédiat. Elle légitime un argument que plusieurs équipes peinaient à défendre devant leur direction : il existe désormais une infrastructure publique en construction qui pourrait, à terme, fournir des données d'entraînement et de fine-tuning conformes au droit québécois et alignées avec les attentes culturelles locales. Pour les organismes publics soumis à la directive sur l'IA dont la deadline approche, c'est aussi un signal que le gouvernement entend offrir, au-delà du cadre réglementaire, une boîte à outils technique.

Reste à voir si la phase 2026-2027 produira les livrables attendus, et si la feuille de route débouchera sur un engagement à la hauteur de l'ambition. La prochaine échéance significative est la publication des projets pilotes retenus, prévue à l'automne.

Sources


Partager :
FB
Florian Brobst
Fondateur & Directeur

Spécialiste en gouvernance de l’intelligence artificielle, Florian accompagne les organisations dans la mise en place de cadres de gouvernance responsables et conformes aux réglementations émergentes.

Restez informé

Abonnez-vous à notre infolettre pour ne rien manquer.

Nous contacter

Ce site utilise des cookies essentiels et fonctionnels pour améliorer votre expérience. Politique de confidentialité