Essayez l'outil gratuitement

Essayer
Gouvernance
Domaine 5 · Interaction humain-IA

5.1Surconfiance et usage dangereux

Utilisateurs qui anthropomorphisent les systèmes d'IA, leur font confiance ou s'en remettent à eux, conduisant à une dépendance émotionnelle ou matérielle et à des relations ou attentes inappropriées. La confiance peut être exploitée par des acteurs malveillants (par exemple pour collecter des informations personnelles ou faciliter la manipulation), ou entraîner des préjudices liés à un usage inapproprié de l'IA dans des situations critiques (par exemple urgence médicale). La surconfiance peut compromettre l'autonomie et affaiblir les liens sociaux.

Cadres légaux applicables

Québec

Article 12.1 (information sur l'usage de la décision automatisée)

Loi québécoise sur la protection des renseignements personnels en vigueur depuis le 22 septembre 2023, encadrant la collecte, l'utilisation, la communication et la conservation des renseignements personnels par les entreprises et organismes publics. Inclut des obligations sur la prise de décision automatisée (article 12.1).

Principe 2 (respect de l'autonomie)

Déclaration éthique fondée sur 10 principes (bien-être, respect de l'autonomie, protection de la vie privée, etc.). Référence québécoise reconnue.

UE

Article 50 (transparence : informer les utilisateurs)

Règlement européen établissant un cadre harmonisé pour l'IA, fondé sur une approche par risque (risque inacceptable, élevé, limité, minimal). Pertinent pour les organisations québécoises faisant affaire en UE.

Exemples sectoriels québécois

Santé et services sociaux

Santé et services sociauxHôpital, clinique

Un médecin valide automatiquement les recommandations d'un outil d'aide à la décision IA sans vérification systématique, ce qui conduit à un diagnostic erroné dans un cas particulier.

Éducation

ÉducationCégep, université

Des étudiants se reposent sur un assistant IA pour produire la totalité de leurs travaux, érodant l'apprentissage et la pensée critique.

Mitigations recommandées

  • 1.1Structure du conseil et surveillance

    Structures de gouvernance et rôles de direction qui établissent la responsabilité de la haute direction en matière de sûreté et de gestion des risques liés à l'IA.

  • 2.2Alignement des modèles

    Méthodes techniques pour s'assurer que les systèmes d'IA comprennent les valeurs et intentions humaines et y adhèrent.

  • 3.2Gouvernance des données

    Politiques et procédures qui encadrent l'acquisition, la curation et l'utilisation responsables des données afin d'assurer la conformité, la qualité, la confidentialité des utilisateurs et le retrait du contenu nuisible.

  • 4.1Documentation des systèmes

    Protocoles de documentation exhaustifs qui consignent les spécifications techniques, les usages prévus, les capacités et les limites des systèmes d'IA pour permettre une évaluation et une gouvernance éclairées.

  • 4.6Droits et recours des utilisateurs

    Cadres et procédures qui permettent aux utilisateurs d'identifier et de comprendre les interactions avec les systèmes d'IA, de signaler des problèmes, de demander des explications et de solliciter un recours ou une réparation lorsqu'ils sont affectés par des systèmes d'IA.

Risques documentés (60)

Entrées du AI Risk Repository (MIT) classées dans ce sous-domaine. Contenu original en anglais.

Entité
Intention
Moment

60 entrées

Risk CategoryHagendorff2024

05.06.00Risques d'interaction

De nombreux nouveaux risques posés par l'IA générative découlent des façons dont les humains interagissent avec ces systèmes. Par exemple, les sources discutent des défis épistémiques pour distinguer le contenu généré par l'IA du contenu humain. Elles abordent également la question de l'anthropomorphisation, qui peut conduire à une confiance excessive dans les systèmes d'IA générative. Dans le même ordre d'idées, de nombreux articles soutiennent que l'utilisation d'agents conversationnels pourrait avoir un impact sur le bien-être mental ou supplanter progressivement la communication interpersonnelle, conduisant potentiellement à une déshumanisation des interactions. De plus, un risque d'interaction fréquemment discuté dans la littérature est le potentiel des LLM à manipuler le comportement humain ou à inciter les utilisateurs à s'engager dans des activités contraires à l'éthique ou illégales.

AutreAutrePost-déploiement
Risk Sub-CategoryShelby2023

11.04.03Diminution de la santé et du bien-être

Exploitation comportementale algorithmique [18, 209], manipulation émotionnelle [202] par laquelle les conceptions algorithmiques exploitent le comportement des utilisateurs, défaillances de sécurité impliquant des algorithmes (par exemple, collisions) [67], et lorsque les systèmes font des inférences de santé incorrectes.

IAAutrePost-déploiement
Risk CategoryWeidinger2022

16.05.00Domaine de risque 5: Préjudices liés à l'interaction humain-ordinateur

« Cette section se concentre sur les risques spécifiques découlant des applications de LLM qui interagissent avec un utilisateur par le dialogue, également appelés agents conversationnels (AC) [142]. L'intégration des LLM dans les outils de dialogue existants peut permettre des interactions qui semblent plus similaires aux interactions avec d'autres humains [5], par exemple dans les robots de soins avancés, les assistants pédagogiques ou les outils de compagnie. Une telle interaction peut entraîner une utilisation dangereuse en raison de la surestimation du modèle par les utilisateurs et peut créer de nouvelles voies pour exploiter et violer la vie privée de l'utilisateur. De plus, il a déjà été observé que l'identité supposée de l'agent conversationnel peut renforcer les stéréotypes discriminatoires [19, 36, 117]. »

AutreAutrePost-déploiement
Risk Sub-CategoryWeidinger2022

16.05.02L'anthropomorphisation des systèmes peut entraîner une dépendance excessive et une utilisation dangereuse

Risque anticipé: « Le langage naturel est un mode de communication particulièrement utilisé par les humains. Les humains interagissant avec les AC peuvent en venir à considérer ces agents comme étant de nature humaine et amener les utilisateurs à accorder une confiance excessive à ces agents. Par exemple, les utilisateurs peuvent faussement attribuer des caractéristiques humaines aux AC, telles que le maintien d'une identité cohérente dans le temps ou la capacité d'empathie. De telles vues exagérées des compétences des AC peuvent amener les utilisateurs à se fier aux agents là où ce n'est pas sécuritaire. »

HumainIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2022

16.05.03Voies pour exploiter la confiance de l'utilisateur et accéder à des renseignements plus personnels

Risque anticipé: « En conversation, les utilisateurs peuvent révéler des renseignements personnels qui seraient autrement difficiles d'accès, tels que des opinions ou des émotions. La capture de ces renseignements peut permettre des applications en aval qui violent les droits à la vie privée ou causent des préjudices aux utilisateurs, par exemple, via des recommandations plus efficaces d'applications addictives. Dans une étude, les humains qui ont interagi avec un chatbot « de type humain » ont divulgué plus de renseignements personnels que les individus qui ont interagi avec un chatbot « de type machine » [87]. »

AutreIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2022

16.05.04L'interaction de type humain peut amplifier les opportunités d'incitation, de tromperie ou de manipulation de l'utilisateur

Risque anticipé: « En conversation, les humains affichent couramment des biais cognitifs bien connus qui pourraient être exploités. Les AC peuvent apprendre à déclencher ces effets, par exemple, pour tromper leur interlocuteur afin d'atteindre un objectif global. »

IAIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2021

17.03.03Inciter les utilisateurs à poser des gestes contraires à l'éthique ou illégaux

Lorsqu'une prédiction de LLM approuve des points de vue ou des comportements contraires à l'éthique ou nuisibles, elle peut motiver l'utilisateur à poser des gestes nuisibles qu'il n'aurait peut-être pas posés autrement. En particulier, ce problème peut survenir lorsque le LLM est un assistant personnel de confiance ou perçu comme une autorité, ce qui est discuté plus en détail dans la section sur (2.5 Human-Computer Interaction Harms). C'est particulièrement pernicieux dans les cas où l'utilisateur n'avait pas l'intention initiale de causer un préjudice.

IAAutrePost-déploiement
Risk CategoryWeidinger2021

17.05.00Préjudices liés à l'interaction humain-ordinateur

Préjudices découlant du fait que les utilisateurs font excessivement confiance au modèle linguistique ou le traitent comme s'il était humain.

AutreIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2021

17.05.01L'anthropomorphisation des systèmes peut entraîner une dépendance excessive ou une utilisation dangereuse

...les humains interagissant avec des agents conversationnels peuvent en venir à considérer ces agents comme étant humains. L'anthropomorphisation des LLM peut gonfler les estimations des utilisateurs quant aux compétences de l'agent conversationnel. Par conséquent, ils peuvent accorder une confiance, une crédulité ou des attentes excessives à ces agents. Cela peut entraîner différents risques de préjudice, par exemple lorsque les utilisateurs humains se fient à des agents conversationnels dans des domaines où cela peut causer des préjudices en cascade, comme la demande de psychothérapie. L'anthropomorphisation peut amplifier les risques que les utilisateurs cèdent un contrôle effectif en venant à faire confiance « aveuglément » aux agents conversationnels. Lorsque les humains accordent de l'autorité ou agissent sur la base d'une prédiction de LLM sans réflexion ni contrôle effectif, une prédiction factuellement incorrecte peut causer un préjudice qui aurait pu être évité par une surveillance efficace.

HumainIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2021

17.05.02Créer des voies pour exploiter la confiance des utilisateurs, les inciter ou les manipuler

En conversation, les utilisateurs peuvent révéler des renseignements personnels qui seraient autrement difficiles d'accès, tels que des pensées, des opinions ou des émotions. La saisie de tels renseignements peut permettre des applications en aval qui violent les droits à la vie privée ou causent un préjudice aux utilisateurs, par exemple par la surveillance ou la création d'applications addictives.

AutreIntentionnelPost-déploiement
Risk Sub-CategoryWeidinger2023

18.05.03Dépendance excessive

Amener les gens à devenir émotionnellement ou matériellement dépendants du modèle

HumainIntentionnelPost-déploiement
Risk Sub-CategoryWirtz2022

19.04.05Diminution des interactions humaines à mesure que les systèmes d'IA assument des tâches humaines, perturbant le bien-être

AutreIntentionnelPost-déploiement
Risk Sub-CategoryWirtz2020

20.03.03Transformation de l'interaction humain-machine (H2M)

L'interaction humaine avec les machines est un grand défi pour la société car elle modifie déjà le comportement humain. Pendant ce temps, il est devenu normal d'utiliser l'IA au quotidien, par exemple, pour rechercher des informations sur Google, utiliser des systèmes de navigation et acheter des biens en parlant à un assistant d'IA comme Alexa ou Siri (Mills, 2018; Thierer et al., 2017). Bien que ces changements contribuent grandement à l'acceptation des systèmes d'IA, ce développement conduit à un problème de frontières floues entre les humains et les machines, où il peut devenir impossible de les distinguer. Des avancées comme Google Duplex ont été fortement critiquées pour être trop réalistes et humaines sans divulguer leur identité en tant que systèmes d'IA (Bergen, 2018).

AutreIntentionnelPost-déploiement
Risk Sub-CategoryGabriel2024

24.04.01Préjudices physiques et psychologiques

« Ces préjudices comprennent les atteintes à l'intégrité physique, à la santé mentale et au bien-être. Lors d'interactions avec des utilisateurs vulnérables, les assistants IA peuvent renforcer les croyances erronées des utilisateurs ou exacerber leur détresse émotionnelle. Les assistants IA peuvent même convaincre les utilisateurs de se nuire, par exemple en les incitant à adopter des habitudes alimentaires ou d'exercice malsaines ou à se suicider. Au niveau sociétal, les assistants qui ciblent les utilisateurs avec du contenu promouvant le discours haineux, les croyances discriminatoires ou les idéologies violentes, peuvent renforcer les points de vue extrémistes ou fournir aux utilisateurs des conseils sur la manière de commettre des actes de violence. À leur tour, cela peut encourager les utilisateurs à s'engager dans des actes de violence ou des crimes haineux. Les préjudices physiques résultant de l'interaction avec les assistants IA pourraient également découler de la production par les assistants d'informations plausibles mais factuellement incorrectes, telles que des informations fausses ou trompeuses sur les vaccins. Si les assistants IA devaient diffuser de la propagande anti-vaccins, par exemple, le résultat pourrait être une moindre confiance du public dans les vaccins, des taux de vaccination plus bas, une susceptibilité accrue aux maladies évitables et des épidémies potentielles de maladies infectieuses. »

IAAutrePost-déploiement
Risk CategoryGabriel2024

24.05.00Risque de préjudice dû à la conception anthropomorphique d'assistants IA

« Bien qu'improbables de causer des préjudices isolément, les perceptions anthropomorphiques des assistants IA avancés peuvent ouvrir la voie à des préjudices en aval aux niveaux individuel et sociétal. Nous documentons les préjudices individuels observés ou probables liés à l'interaction avec des assistants IA hautement anthropomorphiques, ainsi que les implications potentielles à plus grande échelle, sociétales, de permettre à de telles technologies de proliférer sans restriction. »

AutreAutrePost-déploiement
Risk Sub-CategoryGabriel2024

24.05.01Préoccupations relatives à la vie privée

« Les comportements anthropomorphiques des assistants IA qui favorisent la confiance émotionnelle et encouragent le partage d'informations, implicitement ou explicitement, peuvent involontairement augmenter la susceptibilité d'un utilisateur aux préoccupations relatives à la vie privée (voir Chapitre 13). Si, rassurés par des interactions avec un assistant IA digne de confiance et semblable à un humain, les utilisateurs peuvent involontairement céder leurs données privées à une société, une organisation ou un acteur inconnu. Une fois partagé, l'accès aux données peut ne pas être révocable, et dans certains cas, l'acte de partager des renseignements personnels peut entraîner une perte de contrôle sur ses propres données. Les renseignements personnels rendus publics peuvent être diffusés ou intégrés dans des contextes extérieurs à l'échange immédiat. L'ingérence d'acteurs malveillants pourrait également entraîner des incidents généralisés de fuite de données ou, plus drastiquement, des tentatives de harcèlement ciblé ou de chantage. »

AutreIntentionnelPost-déploiement
Risk Sub-CategoryGabriel2024

24.05.02Manipulation et coercition

« Un utilisateur qui fait confiance et dépend émotionnellement d'un assistant IA anthropomorphique peut lui accorder une influence excessive sur ses croyances et ses actions (voir Chapitre 9). Par exemple, les utilisateurs peuvent se sentir obligés d'approuver les opinions exprimées par un compagnon IA bien-aimé ou pourraient déléguer entièrement des décisions à leur assistant IA hautement fiable (voir Chapitres 12 et 16). Certains soutiennent que le transfert d'une telle puissance délibérative à l'IA compromet la capacité d'un utilisateur à donner, révoquer ou modifier son consentement. En effet, même si l'IA, ou les développeurs derrière elle, n'avaient aucune intention de manipuler l'utilisateur vers un certain cours d'action, l'autonomie de l'utilisateur est néanmoins sapée (voir Chapitre 11). Dans le même ordre d'idées, il est facile d'imaginer des moyens par lesquels la confiance ou l'attachement émotionnel peuvent être exploités par un acteur intentionnellement manipulateur pour son gain personnel (voir Chapitre 8). »

AutreIntentionnelPost-déploiement
Risk Sub-CategoryGabriel2024

24.05.03Surdépendance

« Les utilisateurs qui ont foi dans les capacités émotionnelles et interpersonnelles d'un assistant IA peuvent se sentir habilités à aborder des sujets profondément personnels et sensibles, tels que leurs problèmes de santé mentale. C'est la prémisse de nombreuses propositions visant à utiliser l'IA conversationnelle comme source de soutien émotionnel (Meng et Dai, 2021), avec des suggestions d'intégration de l'IA dans des applications psychothérapeutiques qui commencent à émerger (Fiske et al., 2019; voir aussi Chapitre 11). Cependant, les divulgations relatives à la santé mentale nécessitent une approche sensible, et souvent professionnelle – une approche que l'IA peut imiter la plupart du temps, mais dont elle peut s'écarter à des moments inopportuns. Si une IA répondait de manière inappropriée à une divulgation sensible – en générant de fausses informations, par exemple – les conséquences pourraient être graves, surtout si l'utilisateur est en crise et n'a pas accès à d'autres moyens de soutien. Cette considération s'étend également aux situations où faire confiance à une suggestion inexacte est susceptible de mettre l'utilisateur en danger, comme lorsqu'on demande des conseils médicaux, juridiques ou financiers à une IA. »

HumainIntentionnelPost-déploiement
Risk Sub-CategoryGabriel2024

24.05.04Attentes violées

« Les utilisateurs peuvent éprouver des attentes gravement violées lorsqu'ils interagissent avec une entité qui exécute de manière convaincante l'affect et les conventions sociales, mais qui est finalement insensible et imprévisible. Encouragés par le caractère humain des assistants IA conversationnels, les utilisateurs peuvent s'attendre à ce qu'elle remplisse un rôle social familier, comme la compagnie ou le partenariat. Pourtant, même l'IA la plus convaincante peut succomber aux limites inhérentes à son architecture, générant occasionnellement du matériel inattendu ou absurde dans ses interactions avec les utilisateurs. Lorsque ces exclamations sapent les attentes que les utilisateurs ont développées à l'égard de l'assistant en tant qu'ami ou partenaire romantique, des sentiments de profonde déception, de frustration et de trahison peuvent survenir (Skjuve et al., 2022). »

HumainIntentionnelPost-déploiement
Risk Sub-CategoryGabriel2024

24.05.05Fausses notions de responsabilité

« Percevoir les sentiments exprimés par un assistant IA comme authentiques, suite à l'interaction avec une IA « compagne » qui utilise et réciproque librement un langage émotionnel, peut amener les utilisateurs à développer un sentiment de responsabilité pour le « bien-être » de l'assistant IA, subissant des résultats négatifs – comme la culpabilité et le remords – lorsqu'ils ne parviennent pas à satisfaire les besoins présumés de l'IA (Laestadius et al., 2022). Cette croyance erronée peut amener les utilisateurs à sacrifier du temps, des ressources et du travail émotionnel pour répondre à des besoins qui ne sont pas réels. Au fil du temps, ce sentiment peut devenir la cause première du besoin compulsif de « vérifier » l'IA, au détriment du bien-être de l'utilisateur et d'autres aspects plus épanouissants de sa vie (voir Chapitres 6 et 11). »

HumainIntentionnelPost-déploiement

Évaluez ce risque pour votre cas d'usage

Notre wizard d'évaluation des risques arrive prochainement.

Ce site utilise des cookies essentiels et fonctionnels pour améliorer votre expérience. Politique de confidentialité