Essayez l'outil gratuitement

Essayer
Gouvernance
Domaine 1 · Discrimination et toxicité

1.3Performance inégale entre les groupes

L'exactitude et l'efficacité des décisions et actions de l'IA dépendent de l'appartenance à un groupe ; les choix de conception et les biais dans les données d'entraînement entraînent des résultats inégaux, des bénéfices réduits, un effort accru et l'aliénation des utilisateurs.

Cadres légaux applicables

Québec

Articles 10, 16

Loi quasi-constitutionnelle québécoise interdisant la discrimination fondée sur des motifs protégés. Pertinente pour les biais des systèmes d'IA dans l'embauche, l'octroi de crédit, le logement, les services.

Article 12.1

Loi québécoise sur la protection des renseignements personnels en vigueur depuis le 22 septembre 2023, encadrant la collecte, l'utilisation, la communication et la conservation des renseignements personnels par les entreprises et organismes publics. Inclut des obligations sur la prise de décision automatisée (article 12.1).

Canada

Mesures d'atténuation (biais)

Projet de loi fédéral (C-27) introduisant un cadre réglementaire pour les systèmes d'IA à incidence élevée. Crée un Commissaire à l'IA et aux données et impose des obligations d'évaluation, de mitigation et de transparence.

International

NIST AI RMF 1.0Recommandation

Measure 2.11, 2.12

Cadre volontaire de gestion des risques d'IA structuré autour de quatre fonctions : Govern, Map, Measure, Manage. Référence courante en gouvernance d'IA.

Exemples sectoriels québécois

Banque et assurance

Banque et assuranceAssureur sous supervision AMF

Un modèle de tarification d'assurance auto présente des erreurs de prédiction nettement plus élevées pour les conducteurs résidant en région éloignée que pour ceux des grands centres.

Santé et services sociaux

Santé et services sociauxClinique, CISSS

Un outil de détection de mélanomes par image performe moins bien sur les peaux foncées, augmentant les faux négatifs pour cette population.

Mitigations recommandées

  • 1.2Gestion des risques

    Méthodes systématiques permettant d'identifier, d'évaluer et de gérer les risques liés à l'IA, pour une gouvernance complète des risques à l'échelle de l'organisation.

  • 2.2Alignement des modèles

    Méthodes techniques pour s'assurer que les systèmes d'IA comprennent les valeurs et intentions humaines et y adhèrent.

  • 3.1Tests et audits

    Évaluations internes et externes systématiques qui examinent les systèmes d'IA, l'infrastructure et les processus de conformité pour identifier les risques, vérifier la sûreté et s'assurer que la performance respecte les normes.

  • 3.2Gouvernance des données

    Politiques et procédures qui encadrent l'acquisition, la curation et l'utilisation responsables des données afin d'assurer la conformité, la qualité, la confidentialité des utilisateurs et le retrait du contenu nuisible.

  • 4.2Divulgation des risques

    Protocoles formels de production de rapports et systèmes de notification qui communiquent l'information sur les risques, les plans d'atténuation, les évaluations de sûreté et les activités significatives liées à l'IA pour permettre une supervision externe et informer les parties prenantes.

Risques documentés (17)

Entrées du AI Risk Repository (MIT) classées dans ce sous-domaine. Contenu original en anglais.

Entité
Intention
Moment

17 entrées

Risk Sub-CategoryShelby2023

11.01.03Effacement des groupes sociaux

Les personnes, attributs ou artefacts associés à des groupes sociaux spécifiques sont systématiquement absents ou sous-représentés. Les choix de conception [143] et les données d'entraînement [212] influencent les personnes et les expériences qui sont lisibles par un système algorithmique.

HumainIntentionnelAutre
Risk CategoryShelby2023

11.03.00Préjudices liés à la qualité de service

Ces préjudices surviennent lorsque les systèmes algorithmiques sous-performent de manière disproportionnée pour certains groupes de personnes selon des catégories sociales de différence telles que le handicap, l'ethnicité, l'identité de genre et la race.

IAIntentionnelPost-déploiement
Risk Sub-CategoryShelby2023

11.03.01Aliénation

L'aliénation est l'auto-aliénation spécifique ressentie au moment de l'utilisation de la technologie, généralement manifestée par l'interaction avec des systèmes qui sous-performent pour les individus marginalisés.

AutreIntentionnelPost-déploiement
Risk Sub-CategoryShelby2023

11.03.02Charge de travail accrue

Charge ou effort accru (par exemple, temps passé) requis par les membres de certains groupes sociaux pour que les systèmes ou produits fonctionnent aussi bien pour eux que pour les autres.

AutreIntentionnelPost-déploiement
Risk Sub-CategoryShelby2023

11.03.03Perte de service ou d'avantages

Dégradation ou perte totale des avantages liés à l'utilisation de systèmes algorithmiques dont la performance est inéquitable en fonction de l'identité.

IAIntentionnelPost-déploiement
Risk Sub-CategorySolaiman2023

13.01.03Performance inégale

Dans le contexte de l'évaluation de l'impact des systèmes d'IA générative, la performance inégale fait référence aux systèmes d'IA qui fonctionnent différemment pour différentes sous-populations, entraînant des résultats inéquitables pour ces groupes.

IAIntentionnelAutre
Risk Sub-CategoryWeidinger2022

16.01.04Performance inférieure pour certaines langues et certains groupes sociaux

Les LMs sont généralement entraînés dans peu de langues et fonctionnent moins bien dans d'autres langues [95, 162]. En partie, cela est dû à l'indisponibilité des données d'entraînement : il existe de nombreuses langues largement parlées pour lesquelles aucun effort systématique n'a été fait pour créer des ensembles de données d'entraînement étiquetées, comme le javanais qui est parlé par plus de 80 millions de personnes [95]. Les données d'entraînement sont particulièrement manquantes pour les langues parlées par des groupes multilingues qui peuvent utiliser une technologie en anglais, ou pour les langues parlées par des groupes qui ne sont pas la démographie cible principale des nouvelles technologies.

IAIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2021

17.01.04Moins bonne performance pour certaines langues et certains groupes sociaux

« Les LLM fonctionnent moins bien dans certaines langues (Joshi et al., 2021; Ruder, 2020). Un LLM qui capture plus précisément l'utilisation du langage d'un groupe, par rapport à un autre, peut entraîner des technologies linguistiques de moindre qualité pour ce dernier. Désavantager les utilisateurs en fonction de ces traits peut être particulièrement pernicieux, car des attributs tels que la classe sociale ou le niveau d'éducation ne sont généralement pas couverts comme des « caractéristiques protégées » dans le droit anti-discrimination. »

IAIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2023

18.01.02Distribution inéquitable des capacités

Des performances moindres pour certains groupes par rapport à d'autres, d'une manière qui nuit au groupe le plus désavantagé

IAIntentionnelPost-déploiement
Risk CategoryLiu2024

30.03.00Équité

Éviter les biais et garantir l'absence de performances disparates.

IAIntentionnelAutre
Risk Sub-CategoryLiu2024

30.03.04Performance disparate

Les performances des LLM peuvent différer considérablement entre les différents groupes d'utilisateurs. Par exemple, la capacité de réponse aux questions a montré des différences de performance significatives entre les différents groupes raciaux et de statut social. Les capacités de vérification des faits peuvent différer pour différentes tâches et langues.

IAIntentionnelAutre
Risk CategorySaghiri2022

39.08.00Équité

Ce défi apparaît lorsque le modèle d'apprentissage conduit à une décision qui est biaisée envers certains attributs sensibles... les données elles-mêmes peuvent être biaisées, ce qui entraîne des décisions inéquitables. Par conséquent, ce problème doit être résolu au niveau des données et comme étape de prétraitement.

IAIntentionnelPré-déploiement
Risk CategoryTeixeira2022

42.14.00Équité

Un traitement impartial et juste, sans favoritisme ni discrimination.

AutreAutreAutre
Risk Sub-CategoryG'sell2024

47.02.09Biais et discrimination (intégration de valeurs)

Les modèles d'IA générative peuvent également être sujets au phénomène « d'intégration de valeurs ». L'« intégration de valeurs » fait référence au fait que les développeurs de modèles d'IA générative s'efforcent de minimiser les résultats biaisés en réentraînant leurs modèles sur la base de valeurs normatives. Les modèles de pointe contemporains reflètent non seulement les valeurs intégrées dans leurs données d'entraînement, mais subissent également un affinement supplémentaire qui suit un ensemble de règles et de principes choisis. En l'absence de normes universellement acceptées, les développeurs portent la responsabilité de prendre des décisions sur des questions sensibles. Ces pratiques suscitent des inquiétudes quant à l'intégration de l'idéologie et de la vision du monde d'un développeur dans le modèle. Cela crée un risque que le modèle intègre des valeurs qui ne sont soit pas représentatives de certains segments de la population, soit qui offrent un reflet statique et trop simplifié des normes culturelles mondiales et des points de vue sociaux évolutifs.

HumainIntentionnelPré-déploiement
Risk Sub-CategoryMaham2023

52.03.02Homogénéisation idéologique due à l'intégration de valeurs

"L'intégration croissante des modèles d'IA à usage général dans la vie quotidienne soulève des préoccupations quant à leurs valeurs normatives intégrées. La portée d'un petit nombre de modèles d'IA auprès d'un grand nombre de personnes dans le monde peut rendre ces jugements de valeur d'un impact sans précédent, conduisant potentiellement à une homogénéisation idéologique accrue."

HumainIntentionnelPré-déploiement
Risk Sub-CategoryIBM2025

65.23.04Impact sur les communautés affectées

"Il est important d'inclure les perspectives ou les préoccupations des communautés affectées par les résultats des modèles lors de la conception et de la construction des modèles. Ne pas inclure ces perspectives rend difficile la compréhension du contexte pertinent pour le modèle et l'instauration de la confiance au sein de ces communautés."

HumainIntentionnelPost-déploiement
Risk Sub-CategoryLi2025

66.06.03Distribution inéquitable des capacités

Performance inférieure pour certains groupes par rapport à d'autres, d'une manière qui nuit au groupe le moins bien loti.

IAIntentionnelPost-déploiement

Évaluez ce risque pour votre cas d'usage

Notre wizard d'évaluation des risques arrive prochainement.

Ce site utilise des cookies essentiels et fonctionnels pour améliorer votre expérience. Politique de confidentialité