Intelligence artificielle générative
L'intelligence artificielle générative ou IA générative (IAg ou GenAI) est un type de système d'intelligence artificielle (IA) capable de générer du texte, des images, des vidéos ou d'autres médias en réponse à des requêtes (aussi appelées invites, ou en anglais prompts)[1],[2].
Elle semble avoir des applications possibles dans presque tous les domaines, avec une balance des risques et des opportunités encore discutée : l'IA générative est en effet aussi source d'inquiétudes et de défis éthiques, techniques et socioéconomiques à la hauteur des espoirs qu'elle suscite. Elle peut contribuer à des usages abusifs, accidentels ou détournés (militaires notamment), à une suppression massive d'emploi, à une manipulation de la population via la création de fausses nouvelles, de deepfakes[3] ou de nudges numériques[4].
L'IA générative questionne aussi philosophiquement la nature de la conscience, de la créativité, de la paternité[5], et crée de nouvelles interactions homme-machine. Elle est encore (en 2024) peu régulée et la difficulté d’évaluer la qualité et la fiabilité des contenus générés ou l’impact sur la créativité et la propriété intellectuelle humaines est croissante. Certains experts craignent que des IA génératives à venir soient capables de manipuler les humains, d'accéder à des systèmes d'armes, d'exploiter des failles de cybersécurité, voire peut-être bientôt d'acquérir une forme de conscience ou de devenir incontrôlable au point de menacer l'existence de l'humanité[6]. Un premier sommet mondial en sûreté de l'IA a été organisé en novembre 2023 à Bletchey Park au Royaume-Uni, où la création d'un équivalent du GIEC pour informer sur les risques liés à l'IA a notamment été discutée[7].
Vocabulaire
La littérature spécialisée anglophone parle aussi d'AIGC, l'acronyme de Artificial Intelligence Generated Content (« Contenu Généré par Intelligence Artificielle »)[8].
L'IA générative est associée à des « modèles génératifs », qui produisent de multiples sorties (outputs ou résultats, qui vont du texte et de l'image à des agents conversationnels ou à l'impression 3D). Un modèle génératif peut être utilisé comme « fondation » d’autres systèmes[9]. Et plusieurs modèles génératifs peuvent être associés. Par exemple avec ChatGPT, où le générateur de texte GPT-4 peut envoyer des requêtes à DALL-E 3 pour générer des images[10].
Une IA est dite multimodale quand elle peut analyser ou générer différents types de données. Par exemple, l'IA générative Google Gemini est multimodale, car bien que ne générant que du texte, elle peut analyser du texte, des images, du son, et des vidéos[11].
L'IA générative ne doit pas être confondue avec l'IA générale, qui est souvent définie comme une IA au moins aussi compétente que l'humain dans pratiquement toutes les tâches cognitives[12].
Un modèle de fondation, tel que défini par l’université de Stanford, est un modèle large (de grande taille) fondé sur une architecture de réseau de neurones profond, et entraîné sur une quantité massive de données non annotées (généralement par apprentissage auto-supervisé)[9]. Les grands modèles de langue (LLM pour Large Language Model) en font partie (entraînés sur un grand corpus de textes)[9]. Leur pré-entrainement est long et couteux, mais ils peuvent ensuite, moyennant quelques réglages, être adaptés et optimisés pour de nouvelles tâches, sans nécessiter beaucoup de données supplémentaires[9].
Le , l'Open source initiative propose une première version de définition d'intelligence artificielle générative open-source[13], inspirée des 4 libertés de la définition du logiciel libre par la Free Software Foundation[14]. Celle-ci impose une description complète des données d'entraînement sans pour autant imposer de mécanisme juridique pour décrire ces données. Cette définition exclut notamment Llama, l'IA générative de l'entreprise Meta, anciennement Facebook[15].
Capacités
Selon une analyse d’OpenAI en 2018 : « depuis 2012, la quantité de calcul utilisée dans les plus grands entraînements d’IA a augmenté de manière exponentielle avec un temps de doublement de 3,4 mois (en comparaison, la loi de Moore avait une période de doublement de deux ans). Depuis 2012, cette métrique[16] a augmenté de plus de 300 000 fois (une période de doublement de deux ans ne donnerait qu’une augmentation de sept fois). »[17] Cette augmentation de la puissance de calcul a facilité l’émergence d’IA pouvant générer du texte, du code informatique, de la musique, des voix, des images, de la vidéo[18], des modèles 3D ou encore des séquences de mouvements.
Ces systèmes d'IA s'inspirent des données d'entraînement pour créer du contenu inédit. Ils ne se contentent pas de classer les données d'entrée qu'on leur a fourni, ni de prédire des données statistiquement probables. Ils génèrent des contenus nouveaux qui ne sont en général que partiellement similaires aux données sur lesquelles ils ont été entraînés[18]. Divers filtres ou curseurs permettent de donner une plus ou moins grande liberté à l'IA[9]. Certains modèles d'IA permettent d'ajouter aux invites textuelles des "prompts négatifs" (qui sont des invites expliquant ce qu'on ne veut pas voir dans la réponse attendue de l'IA)
Les versions publiques de grands modèles d'IA générative disponibles en 2022 et 2023 produisent des contenus modulés et filtrés de manière à limiter leurs biais, les contenus trompeurs, dangereux, racistes, biaisés, choquants, haineux, non sollicités, les images pornographiques ou sexuellement explicites[19],[20],[21],[22]. Au début des années 2020, la puissance de calcul de l’IA a doublé tous les six à dix mois, permettant aux modèles d’IA de progresser à un rythme exponentiel.
Les anglophones parlent de « Frontier AI » pour désigner les modèles d'IA aux capacités les plus élevées et générales, et qui pourraient présenter des risques nouveaux[23]. Ce type d'IA s'est faite connaitre du public par ChatGPT (et sa variante Bing Chat), un chatbot (agent conversationnel programmable) conçu par OpenAI à partir de ses grands modèles de langage de fondation GPT-3 et GPT-4[24], ainsi que par Bard, un chatbot de Google basé sur LaMDA. D'autres modèles d'IA générative incluent des systèmes artistiques d'intelligence artificielle tels que Stable Diffusion, Midjourney et DALL-E[25]. Ces IA ont un très large spectre d'applications potentielles dans des domaines créatifs (arts plastiques, cinéma, musique, écriture, design, météo, architecture...), mais aussi dans les secteurs de la santé, de la finance, des jeux vidéo et des simulateurs, dans tous les domaines des sciences et techniques, des sciences sociales, de l'industrie et de la connaissance. Elles ont récemment permis un bond en avant en biologie moléculaire et en compréhension de phénomènes physiques complexes. Elles permettent de synthétiser des visages et des voix humaines réalistes. Elles offrent de nouveaux modes d'exploration d'hypothèses et de scenarios (notamment depuis peu grâce à la production de données synthétiques sophistiquées, issues du domaine de la recherche générative assistée par IA)[réf. nécessaire].
Technologies sous-jacentes
Les cadres technologiques et conceptuels les plus importants pour aborder l'IA générative sont en cours d’élaboration depuis un certain temps[5], mais ils n'ont vraiment abouti que dans les années 2020 à plusieurs types de modèles d'IA particulièrement efficaces :
- les réseaux antagonistes génératifs (GAN), composés de deux parties : un réseau générateur créant de nouveaux échantillons de données, et un réseau discriminateur qui évalue si les échantillons sont réels ou faux. Les deux réseaux sont entraînés ensemble dans le cadre d'un processus concurrentiel, le réseau générateur essayant continuellement de produire des échantillons de meilleure qualité et plus réalistes, tandis que le réseau discriminateur s'efforce d'identifier avec précision les faux échantillons ;
- les auto-encodeurs variationnels (VAE) ;
- les modèles de diffusion (ex. : DALL-E, Stable Diffusion)[26] ;
- les transformeurs génératifs pré-entraînés (Generative Pretrained Transformers, ou GPT en anglais)[27],[28], un type de modèle d'apprentissage profond basé sur l'architecture transformeur, pré-entraîné sur de grands ensembles de données non étiquetées, équipé d'un « mécanisme d'attention » et capable de générer du nouveau texte semblable à celui écrit par des humains[29],[30].
L'IA générative est encore loin de répondre « de manière fiable ou digne de confiance, et il reste encore beaucoup de travail à faire pour rendre ces sources fiables et impartiales »[5], mais elle a des applications (actuelles ou potentielles) dans des domaines aussi variés que l’art, l'industrie, le jeu vidéo, la musique, la médecine, le développement logiciel, le marketing, les biotechnologies, la finance ou encore la mode[31],[32].
Modalités
L'IA générative est souvent entraînée par apprentissage auto-supervisé sur de vastes ensemble de données. Les capacités d'une IA générative dépendent de la modalité ou du type d'ensemble de données utilisé.
L'IA générative est dite « unimodale » quand elle ne peut accepter et créer qu'un seul type de données (du texte par exemple) ; et « multimodale » quand elle peut traiter ou générer plusieurs types de contenus (par exemple du texte, des images ou du son)[33]. Les modalités possibles incluent :
- Texte : les systèmes d'IA générative formés sur des mots ou des jetons de mots (tokens) incluent GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 et d'autres. Ils sont capables de traiter du langage naturel, de faire de la traduction automatique et de générer du langage naturel et peuvent être utilisés comme modèles de base pour d'autres tâches. Deux des principaux ensembles de données sont BookCorpus et Wikipédia.
- Code : Outre les textes en langage naturel, de grands modèles de langage peuvent être entraînés sur du texte en langage de programmation, ce qui leur permet de générer du code source de nouveaux programmes informatiques.
- Images : Les systèmes d'IA générative formés sur des ensembles d'images avec des légendes textuelles comprennent Imagen, DALL-E, Midjourney, Stable Diffusion et autres. Ils sont couramment utilisés pour la génération de texte en image et le transfert de style neuronal[34]. Les jeux de données sont notamment LAION-5B et d'autres.
- Musique : les systèmes d'IA générative tels que MusicLM peuvent être formés sur les formes d'ondes sonores de la musique enregistrée avec des annotations textuelles afin de générer de nouveaux échantillons musicaux fondés sur des descriptions de texte telles qu'« une mélodie de violon apaisante soutenue par un riff de guitare distordu ».
- Vidéo : L'IA générative entraînée sur une vidéo annotée peut générer des clips vidéo cohérents dans le temps. Des IAs comme Gen1 par RunwayML[35] et Make-A-Video de Meta[36] peuvent générer des vidéos de cette manière.
Investissements financiers
L'investissement public et privé dans l'IA générative a bondi, à partir du début des années 2020, principalement avec de grandes entreprises telles que Microsoft, Google et Baidu, mais aussi avec de nombreuses petites entreprises développant des modèles d'IA générative[1],[37],[38]. Les grands acteurs du cloud public cherchent aussi à tirer des revenus de l'IA générative, via des acquisitions et des partenariats stratégiques[39].
Selon le PitchBook report (mars 2023) de la plateforme sur le capital-risque PitchBook, le marché de l'IA générative devrait atteindre 42,6 milliards de dollars en 2023. Si les chatbots, les assistants virtuels et les voicebots ont capté 57,8 % des investissements en capital-risque dans les interfaces en langage naturel en 2022, les secteurs de la programmation et de la santé devraient aussi générer des revenus importants[40]. Cependant, peu de start-up de l'IA ont éprouvé le besoin d'entrer en bourse en 2023, ce qui a limité les bénéfices à court terme des investisseurs (« baisse de 94 % par rapport à la même période [3 premiers trimestres de l'année] en 2021 »)[41],[42].
Selon un rapport de McKinsey[43], l'IA générative est en 2023 déjà utilisée par environ un tiers des organisations interrogées, notamment dans les secteurs de la technologie, des médias et du divertissement, de la santé et des services financiers. Elle a un fort potentiel transformatif de l'économie, en augmentant la productivité, l'innovation, la personnalisation et la qualité des produits et services, en créant de nouveaux produits et services ; l'IA générative devrait apporter l'équivalent de 2,6 à 4,4 milliards de dollars par an à l'économie mondiale de 2023 à 2040 (2 à 4 % du PIB mondial), avec des opportunités, mais aussi avec des défis, risques et effets complexes sur le travail, les compétences et la société. Les organisations qui n'investissent pas dans cette technologie risquent de se trouver dépassées.
De son côté J.P. Morgan Private Bank Asia confirme en septembre 2023 des opportunités d'investissement et estime que les secteurs des semi-conducteurs, des cartes graphiques et autres puces de calcul hautement performantes, des fonderies de circuits intégrés, des datacenters, des hyperscalers et des logiciels devraient profiter de l'IA. Cependant, la banque met en garde contre les risques de sécurité, d'éthique, de règlementation et de concurrence, et recommande aux investisseurs une approche prudente et responsable[44],[45].
Transparence
En 2023, il est reproché aux systèmes d’IA et notamment d'IA générative de ne pas être transparents, autrement dit d'être des « boites noires » dont même les développeurs de l'IA ne comprennent pas le fonctionnement interne[46].
Une étude laisse penser qu'il pourrait être possible de rendre plus transparente cette boite noire grâce à l’analyse de Fourier appliquée aux réseaux de neurones profonds. Des chercheurs de l’Université Rice ont en effet formé un réseau de neurones profonds à reconnaître les flux complexes d’air ou d’eau et à prédire comment ces flux évoluent. Ils lui ont ensuite appliqué une analyse de Fourier (sur les équations régissant le réseau de neurones). Cette méthode a révélé ce que le réseau de neurones avait appris, et surtout comment il était parvenu à ces connaissances[47].
De grands concepteurs d’IA comme OpenAI[19] et Meta[48] ont commencé à publier des « Fiches Système »[49] (ou « System Cards », inspirées des « Model Cards », une norme largement acceptée pour la documentation des modèles d’IA). Ces fiches contiennent des informations sur l’architecture et le fonctionnement de leurs IA : objectifs, composants, données, performances, impacts potentiels d’un système d’IA et mesures d’atténuation… C’est une première étape vers une documentation des systèmes d’IA, lesquels combinent souvent plusieurs modèles et technologies interagissant pour accomplir des tâches spécifiques.
Usages malveillants
En 2024, un employé d'une multinationale de Hong-Kong a été trompé par une visioconférence où tous les participants avaient été créés à l'aide de l'intelligence artificielle pour imiter de vrais collègues. Il a reçu l'ordre d'effectuer des virements, et plus de 25 millions de dollars ont ainsi été détournés[50].
Régulation et gestion des risques
Différents tests comme HELM[51] ou MMLU[52] permettent d'estimer les capacités ou les comportements indésirables (réponses biaisées, fausses, hallucinations, reprise de contenu protégé par le droit d’auteur...) de grands modèles de langage.
L'Union européenne, les États-Unis et la Chine ont commencé à se doter de législations sur le numérique commençant à prendre en compte l'IA, mais qui s'est avérée dépassée par les progrès rapides de l'IA générative.
En 2023, de nombreuses alertes ont été lancées par des pionniers du deep learning (ex. : Geoffrey Hinton, Yoshua Bengio, Sam Altman ou Demis Hassabis). Notamment via une demande de moratoire de 6 mois dans le développement de l’IA (lancé le 28 mars par le Future of Life Institute qui sera signée par plus de 30 000 personnes dont le lauréat du prix Turing Yoshua Bengio et Elon Musk). Puis, en mai 2023, une déclaration du Center for AI Safety (« Centre pour la sûreté de l'IA ») affirmant que « l’atténuation du risque d’extinction de l’humanité lié à l’IA devrait être une priorité mondiale au même titre que la prévention des pandémies et des guerres nucléaires » est signée par d'éminents chercheurs ainsi que par les dirigeants de OpenAI, Google DeepMind et Anthropic[53].
Selon Heidy Khlaaf (directrice chargée de l’assurance de l’apprentissage automatique chez Trail of Bits, une société de recherche et de conseil en cybersécurité), les centrales nucléaires ont des milliers de pages de documents pour prouver que le système ne cause de tort à personne, et pour Melissa Heikkilä : « la chose la plus importante que la communauté de l’IA pourrait apprendre du risque nucléaire est l’importance de la traçabilité »[54], deux choses encore peu développées dans le secteur de l'IA. La réglementation de l'IA est parfois comparée à la réglementation du secteur nucléaire[55]. Sam Altman (PDG d’OpenAI) a suggéré la mise en place d'un système de licences, dans lequel l'entraînement de systèmes d'IA ayant des capacités élevées nécessiterait l'octroi d'une licence, et pour ce faire de se conformer à des exigences de sécurité (de même que les opérateurs d’installations nucléaires sont tenus d’être licenciés par un régulateur nucléaire)[55]. Aidan Gomez (cofondateur de Cohere) a jugé cette formule excessive et détournant l'attention de risques - selon lui plus réels - de l'IA mal utilisée dans les médias sociaux et la médecine[56], de même que Yann LeCun (embauché comme scientifique en chef de l’IA chez Meta, le groupe qui détient Facebook et travaille à la création d'un Métavers) et Joelle Pineau (vice-présidente de la recherche en IA chez Meta) qui jugent ces craintes ridicules et déraisonnables, affirmant que les systèmes d'IA comme ChatGPT ne sont pas encore conscientes et ne peuvent donc pas selon eux manipuler ou détruire l'humanité[57]. Mais en 2023, des chercheurs d’Oxford, de Cambridge, de l’Université de Toronto, de l’Université de Montréal, de Google DeepMind, d’OpenAI, d’Anthropic, de plusieurs organismes de recherche à but non lucratif sur l’IA et Yoshua Bengio (lauréat du prix Turing) suggèrent dans un article[58] que les créateurs des modèles d'IA les plus puissants doivent pouvoir évaluer si ces modèles ont des capacités pouvant présenter des risques « extrêmes » (planification à long terme, manipulation, auto-prolifération, conscience de la situation, capacités à mener des cyberattaques ou à acquérir des armes notamment biologiques...). Les développeurs doivent également apprendre à mesurer la propension des modèles à appliquer leurs capacités à nuire (ceci peut se faire grâce à des « évaluations d’alignement »). Selon eux, « ces évaluations deviendront cruciales pour informer les décideurs politiques et les autres parties prenantes, et pour prendre des décisions responsables concernant l’entraînement, le déploiement et la sécurité des modèles d'IA »[58],[54].
Aleksander Mądry (professeur d’informatique au Cadence Design Systems du MIT, et directeur du Center for Deployable Machine Learning du MIT) a été audité en mars 2023 par le Sous-comité sur la cybersécurité, les technologies de l’information et l’innovation gouvernementale lors d'une cession intitulée « Progrès de l’IA : sommes-nous prêts pour une révolution technologique ? »[59]. Selon Mądry, « nous sommes à un point d’inflexion en ce qui concerne ce que l’IA du futur apportera [...] le gouvernement devrait plutôt s’interroger sur l’objectif et l’explicabilité des algorithmes utilisés par les entreprises, en tant que précurseur à la réglementation » pour s’assurer que l’IA est cohérente avec les objectifs de la société. Ce serait une erreur selon lui de réglementer l’IA comme si elle était humaine – par exemple en demandant à l’IA d’expliquer son raisonnement et en supposant que les réponses qui en résultent sont fiables.
Concernant le risque de suppression massive d'emplois, dans le Time, Altman a annoncé qu’OpenAI aborderait en 2024 le sujet de la redistribution des richesses (« OpenAI mène actuellement une étude de cinq ans sur le revenu universel », qui doit se terminer en 2024)[60]. Rishi Sunak (premier ministre britannique) a invité la communauté internationale à Bletchey park en novembre 2023 pour un premier sommet mondial en sûreté de l'IA, abordant notamment les risques existentiels liés à l'IA[61]. Sunak propose que soit créé un groupe d’experts internationaux, sur le modèle du GIEC, qui serait dans un premier temps chargé de publier un état des lieux de l’IA. Le 1er novembre, la Chine, les États-Unis, l’Union européenne et une vingtaine de pays ont signé la déclaration de Bletchley pour un développement « sûr » de l’intelligence artificielle[62]. La veille, trois de ces pays (France, Allemagne et Italie) avaient signé à Rome un accord de coopération sur l'IA « dans le prolongement des efforts globaux déployés en faveur de la transition numérique et écologique »[63].
En France, le Comité national pilote d’éthique du numérique (CNPEN) a été saisi par le ministre délégué chargé de la Transition numérique et des Télécommunications (20 février 2023) à propos des questions d’éthique « liées à la conception, aux usages, aux impacts sur la société des systèmes d’intelligence artificielle générative ainsi que les accompagnements nécessaires à leur mise en œuvre, en considérant prioritairement la génération automatisée de textes ». Dans son avis du 20 juin 2023[9] : après avoir fait un rappel des concepts, techniques et vocabulaire des systèmes d’intelligence artificielle générative, le CNPEN a produit une réponse, des préconisations, une analyse des enjeux juridiques en environnementaux ; et des suggestions sur les recherches à conduire dès à présent sur le sujet[64].
En février 2024, l'Autorité de la concurrence s'autosaisit et lance un consultation publique des acteurs de l'IA générative en vue d'émettre un avis[65], rendu le 28 juin 2024[66].
- L'Autorité y souligne la main mise croissante du privé sur ce marché ; elle encourage le soutien dans toute l'Europe à un accès du privé local aux supercalculateurs publics, tels que, en France, le supercalculateur Jean Zay), en échange de produits open[66] ; et tout en maintenant une priorité aux recherches académiques[67].
- L'Autorité s'inquiète de l'importance des « barrières à l'entrée » pour le nouveaux entrants de l'IAg. Ces derniers manquent d'accès aux puissances nécessaires de calcul, à d'énormes volumes de données (pour entrainer les modèles), au recrutement de talents rares et coûteux, que les GAFAM américains captent, grâce à des avantages concurrentiels exorbitants (intégration verticale et maitrise des marchés connexes, verrouillage dans les services Cloud, accords non transparents d'exclusivité, prises de participation minoritaires)[67] et fixations arbitraires et déloyales de prix, de restrictions de production et de conditions contractuelles déloyales, comportements discriminatoires[66]. Les IAg comme Anthropic, Mistral, Open AI, Perplexity… sont toutes au moins en partie financées par Google, Amazon, Microsoft, Intel, Salesforce et/ou Nvidia. L'Autorité note que le secteur est dépendant du « logiciel de programmation de puces CUDA de Nvidia (seul environnement parfaitement compatible avec les GPU devenus incontournables pour le calcul accéléré)] » et s'inquiète des « investissements de Nvidia dans des fournisseurs de services cloud spécialisés dans l'IA, tels que Coreweave », un secteur scruté par l'Autorité[66] (cf. visite et saisie inopinée en septembre 2023)[68]. En intégrant l'IAG dans leurs écosystèmes de produits et services - comme le fait Microsoft avec Copilot - les GAFAM renforcent leur position dominante[67]. L’Autorité de la concurrence note que « les investissements dans le secteur ont été multipliés par près de six entre 2022 et 2023. Les entreprises du secteur ont ainsi levé plus de 22 milliards de dollars en 2023 (soit environ 20 milliards d’euros), contre environ 4 milliards de dollars en 2022 (soit environ 3,7 milliards d’euros) »[66]. L'Autorité suggère notamment, à la commission européenne, d'exiger, via le DMA, la transparence sur les participations minoritaires. Pour l'Autorité, les IAg entrainés sur des supercalculateurs publics devraient se voir imposer des critères d'ouverture ; et il faut inventer un équilibre entre une juste rémunération des ayants-droit et l'accès des développeurs d'IA aux données nécessaires pour innover[67].
- De plus, les données francophones utilisées pour entrainer les LLM ne compte que pour 0,2 % du total. Face à ce taux qui est source de biais culturels anglosaxons dans l'IA, la France a lancé le projet Villers-Cotterêts (Cité internationale de la langue française) qui doit notamment ouvrir un large corpus numérique francophone (et de langues régionales), via une base centralisée ouverte à l'apprentissage des IA (dont Albert, l'IA de l'État). Ce corpus est construit à partir des Archives de France, de la Bibliothèque nationale de France, du CNRS et de diverses ONG.
Un autre projet dit Argimi (Artefact, Giskard et Mistral), soutenu par l'AAP « Communs numériques pour l'intelligence artificielle générative », est porté par un consortium de startups souhaitant ouvrir le patrimoine de la BNF et de l'INA à l'apprentissage de LLM créés par ces trois start-ups françaises.
Albert (voir plus haut) est une intelligence artificielle « souveraine » développée par la Direction interministérielle du numérique (DINUM) pour le compte de l'État français[69]. Son objectif est d'assister les agents publics dans leurs tâches quotidiennes, notamment en facilitant la rédaction de réponses aux demandes des usagers et en automatisant certaines procédures administratives[70]. Cette initiative vise à simplifier et à rendre plus efficace l'action publique au bénéfice des citoyens.
Droits d'auteur
Les œuvres et créations générées par des systèmes d'intelligence artificielle générative soulèvent de nombreuses questions concernant la protection des droits d'auteur.
En France, comme dans l'Union européenne, le droit d'auteur repose sur l'idée que seules les créations issues de l'esprit humain peuvent être protégées. L'article L111-1 du code de la propriété intellectuelle prévoit par exemple que « L'auteur d'une oeuvre de l'esprit jouit sur cette oeuvre, du seul fait de sa création, d'un droit de propriété incorporelle exclusif et opposable à tous. »[71] Par conséquent, les œuvres créés par une intelligence artificielle ne peuvent actuellement bénéficier des protections garanties par le code de la propriété intellectuelle.
Au niveau européen, la directive sur le droit d'auteur dans le marché unique numérique (Directive 2019/790) ne prévoit pas de dispositions spécifiques pour les œuvres générées par IA. Toutefois, des débats sont en cours quant à la reconnaissance possible d'une forme de protection juridique pour ces créations, notamment lorsqu'un auteur humain intervient dans le processus de génération.
En réalité, le débat est actuellement aussi bien juridique que philosophique quant au réel propriétaire de l'œuvre : est ce le créateur de l'IA ou l'utilisateur qui a rédigé le prompt ?
L'IA générative, telle qu'elle se développe à partir de 2024, pourrait évoluer vers les formes suivantes :
- Interactive : Déjà en cours de développement, cette IA est capable d'interagir avec le monde réel de manière complexe, en collaborant avec d'autres logiciels, des machines ou des robots. Pour Mustafa Suleyman (cofondateur de DeepMind et ex-vice-président des produits et des politiques d’IA de Google), interrogé par la MIT Technology Review (septembre 2023), c'est l'étape qui suivra l'IA générative, avec les mêmes risques et atouts mais plus difficile à contrôler en cas d'usage malveillant[72]. Pour Demis Hassabis (autre cofondateur de DeepMind), elle « a le potentiel de transformer de nombreux aspects de nos vies »[73].
- Autonome : Représentée à ses débuts par le véhicule autonome, cette IA permettrait à des machines d'accomplir des tâches sans intervention humaine. Les domaines des transports, de la santé et de la sécurité sont les principaux concernés, car cette IA pourrait réduire les risques d'erreur humaine tout en optimisant l'efficacité[74].
- Consciente : Généralement considérée comme une possibilité lointaine, cette IA pourrait ressentir des émotions et avoir une conscience de soi. Cette technologie, encore controversée, soulève des questions éthiques et philosophiques complexes, notamment sur la place des machines dans la société et leurs droits éventuels[75].
- Créative : Cette IA pourrait générer des idées nouvelles et résoudre des problèmes d'une manière créative, sans être strictement limitée par les modèles d'apprentissage précédents. Selon OpenAI, les IA génératives pourraient un jour produire des œuvres artistiques ou des innovations scientifiques comparables aux créations humaines[76].
- Collaborative et éthique : Ce type d'IA serait conçu pour travailler aux côtés des humains, en intégrant des balises éthiques pour éviter les biais et promouvoir des prises de décision équitables. Selon le Conseil Européen pour l’Innovation, l'IA éthique vise à préserver la sécurité et la dignité humaine en intégrant des principes éthiques dès la phase de développement[77].
Références
- (en) Erin Griffith et Cade Metz, « Anthropic Said to Be Closing In on $300 Million in New A.I. Funding », The New York Times, (consulté le ).
- (en) Nate Lanxon, Dina Bass et Jackie Davalos, « A Cheat Sheet to AI Buzzwords and Their Meanings », Bloomberg News, (lire en ligne, consulté le ).
- Ahona Rudra, « Risques de cybersécurité liés à l'IA générative », sur powerdmarc.com, (consulté le ).
- (en) Julia Dhar, Allison Bailey, Stéphanie Mingardon et Jennifer Tankersley, « The Persuasive Power of the Digital Nudge », sur BCG Global, (consulté le ).
- (en) Rachel Gordon, « MIT CSAIL (Laboratoire d’Informatique et d’Intelligence Artificielle) researchers discuss frontiers of generative AI », sur MIT News, (consulté le ).
- (en) Will Douglas Heaven, « How existential risk became the biggest meme in AI », MIT Technology Review, (lire en ligne, consulté le ).
- Alexandre Piquard, « Intelligence artificielle : au sommet de Londres, PDG et dirigeants face au défi de la régulation », Le Monde.fr, (lire en ligne, consulté le ).
- (en-US) Qianqian Yang, Ngai Cheong, Dejiang Wang et Shi Li, « Visualization for a new era: Impact and application of large language models and AIGC to traditional business models », Open Journal Systems, (DOI 10.32629/jai.v7i4.1487, lire en ligne, consulté le ).
- « Avis 7 du CNPEN Systèmes d’intelligence artificielle générative : enjeux d’éthique », sur Comité Consultatif National d’Ethique, (consulté le ).
- Ayush Mittal, « Un examen plus approfondi du DALL-E 3 d'OpenAI », sur Unite.ai, (consulté le ).
- Marin Jérôme, « Google lance Gemini, son nouveau modèle d'IA générative multimodal », L'Usine Digitale, (lire en ligne, consulté le ).
- « Intelligence Artificielle Générale : Google DeepMind propose un cadre pour classer les capacités et le comportement des IAG », sur ActuIA (consulté le ).
- (en) « The Open Source Initiative Announces the Release of the Industry’s First Open Source AI Definition », sur opensource.org, (consulté le )
- Martin Clavey, « IA générative et open source : les services du gouvernement proposent leur grille de lecture », Next Impact, (lire en ligne )
- Martin Clavey, « L’IA open-source a sa définition 1.0 qui exclut les modèles Llama de Meta », Next Impact, (lire en ligne )
- En général, le petaflop/jour est utilisé comme métrique. Un petaflop-jour (pf-jour) consiste à effectuer 10^15 opérations de réseau neuronal par seconde pendant une journée, soit un total d’environ 10^20 opérations. C’est une unité de mesure pratique, similaire au kW/h pour l’énergie. Plutôt que les FLOPS théoriques maximaux du matériel, on cherche à estimer le nombre réel d’opérations faites ; additions et multiplications sont comptées comme des opérations distinctes, et on ignore les modèles d’ensemble. Sur cette période, le temps de doublement pour la ligne de meilleure adéquation est de 3,4 mois.
- (en) « AI and compute », sur openai.com, (consulté le ).
- (en) Adam Pasick, « Artificial Intelligence Glossary: Neural Networks and Other Terms Explained », The New York Times, (lire en ligne, consulté le ).
- (en) « DALL·E 3 system card », sur openai.com, (consulté le ).
- (en) Charlotte Bird, Eddie L. Ungless et Atoosa Kasirzadeh, « Typology of Risks of Generative Text-to-Image Models », AAAI/ACM Conference on AI, Ethics, and Society, (arXiv 2307.05543).
- (en) Abeba Birhane, Vinay Uday Prabhu et Emmanuel Kahembwe, « Multimodal datasets: misogyny, pornography, and malignant stereotypes », Arxiv, (arXiv 2110.01963).
- (en) Jaemin Cho, Abhay Zala et Mohit Bansal, « DALL-Eval: Probing the Reasoning Skills and Social Biases of Text-to-Image Generation Models », ICCV 2023, (arXiv 2202.04053).
- (en) « World leaders gather at UK summit aiming to tackle 'frontier AI' risks », sur France 24, (consulté le ).
- (en) Cade Metz, « OpenAI Plans to Up the Ante in Tech’s A.I. Race », The New York Times, (ISSN 0362-4331, lire en ligne, consulté le ).
- (en) Roose, « A Coming-Out Party for Generative A.I., Silicon Valley's New Craze », The New York Times, (consulté le ).
- (en) Prafulla Dhariwal et Alex Nichol, « Diffusion Models Beat GANs on Image Synthesis », NeurIPS, (arXiv 2105.05233).
- (en) Luhui Hu, « Generative AI and Future », sur Medium, (consulté le ).
- (en) « Generative Artificial Intelligence: Trends and Prospects », sur ieeexplore.ieee.org (consulté le ).
- (en) « Generative AI: a game-changer society needs to be ready for », sur World Economic Forum, (consulté le ).
- (en) Billy Perrigo, « The A to Z of Artificial Intelligence », Time, (lire en ligne, consulté le ).
- (en) « Don't fear an AI-induced jobs apocalypse just yet », The Economist, (consulté le ).
- (en) Holger Harreis, Theodora Koullias, Roger Roberts et Kimberly Te, « Generative AI: Unlocking the future of fashion ».
- (en) Arham Islam, « A History of Generative AI: From GAN to GPT-4 », sur MarkTechPost, (consulté le ).
- (en) Aditya Ramesh, Mikhail Pavlov, Gabriel Goh et Scott Gray, « Zero-Shot Text-to-Image Generation », Proceedings of the 38th International Conference on Machine Learning, PMLR, , p. 8821–8831 (arXiv 2102.12092, lire en ligne, consulté le ).
- (en) Cade Metz, « Instant Videos Could Represent the Next Leap in A.I. Technology », The New York Times, .
- (en) Queenie Wong, « Facebook Parent Meta's AI Tool Can Create Artsy Videos From Text », cnet.com, (consulté le ).
- (en) « The race of the AI labs heats up », The Economist, (consulté le ).
- (en) June Yang et Burak Gokturk, « Google Cloud brings generative AI to developers, businesses, and governments », .
- (en-US) Kyle Wiggers, « VCs continue to pour dollars into generative AI », sur TechCrunch, (consulté le ).
- PitchBook (2023), Rapport sur l'intelligence artificielle et l'apprentissage automatique ; 29 mars 2023 |url= https://pitchbook.com/news/reports/q4-2022-artificial-intelligence-machine-learning-report.
- PitchBook (2024) Rapport : Note d'analyste de PitchBook : Opportunités verticales dans une fenêtre d'introduction en bourse rouverte ; 1er trimestre 2024 ; publié le 4 janvier 2024 | url= https://pitchbook.com/news/reports/q1-2024-pitchbook-analyst-note-vertical-opportunities-in-a-reopened-ipo-window.
- PitchBook (2024), Rapport sur l'intelligence artificielle et l'apprentissage automatique ; 5 décembre 2023 url= https://pitchbook.com/news/reports/q3-2023-artificial-intelligence-machine-learning-report.
- (en) « The state of AI in 2023: Generative AI’s breakout year », sur McKinsey, (consulté le ).
- (en) « Artificial intelligence », sur privatebank.jpmorgan.com (consulté le ).
- (en) « Where are the investment opportunities in AI? », sur privatebank.jpmorgan.com (consulté le ).
- (en) Assad Abbas, « Enhancing AI Transparency and Trust with Composite AI », sur Unite.ai, (consulté le ).
- (en) Charles Q. Choi, « 200-Year-Old Math Opens Up AI’s Mysterious Black Box - IEEE Spectrum », sur spectrum.ieee.org, (consulté le ).
- (en) « System Cards, a new resource for understanding how AI systems work », sur ai.meta.com (consulté le ).
- (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar et Parker Barnes, « Model Cards for Model Reporting », ACM Conference on Fairness, Accountability, and Transparency, ACM, , p. 220–229 (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993, lire en ligne, consulté le ).
- « Intelligence artificielle : un employé perd 25 millions de dollars à cause d’un deepfake », sur Le Point, (consulté le )
- (en) Sharon Goldman, « Stanford debuts first AI benchmark to help understand LLMs », sur VentureBeat, (consulté le ).
- (en) Matthew Sparkes, « Google says its Gemini AI outperforms both GPT-4 and expert humans », sur New Scientist, (consulté le ).
- « L'IA pourrait poser un « risque d'extinction » pour l'humanité, affirment 350 experts », sur Les Echos, (consulté le ).
- (en) Melissa Heikkilä, « To avoid AI doom, learn from nuclear safety », MIT Technology Review, (lire en ligne, consulté le ).
- (en) Heidy Khlaaf, « How AI Can Be Regulated Like Nuclear Energy », sur TIME, (consulté le ).
- (en) George Hammond, « Aidan Gomez: AI threat to human existence is ‘absurd’ distraction from real risks », sur Financial Times, (consulté le ).
- (en) Melissa Heikkilä, « Meta’s AI leaders want you to know fears over AI existential risk are “ridiculous” », sur MIT Technology Review, (consulté le ).
- (en) Toby Shevlane, Sebastian Farquhar, Ben Garfinkel et Mary Phuong, « Model evaluation for extreme risks », Arxiv, (DOI 10.48550/ARXIV.2305.15324, arXiv 2305.15324).
- (en) « Advances in AI: Are We Ready For a Tech Revolution? », sur United States House Committee on Oversight and Accountability, (consulté le ).
- (en) Billy Perrigo, « OpenAI Could Quit Europe Over New AI Rules, CEO Warns », sur Time, (consulté le ).
- « Intelligence artificielle : « Des millions de personnes vont bientôt perdre leur travail » », sur Le Point, (consulté le ).
- « Les Etats-Unis, la Chine et l'UE signent une première déclaration mondiale sur les risques de l'IA », sur BFMTV (consulté le ).
- Olivier Tosseri, « L'Italie, l'Allemagne et la France renforcent leur coopération dans l'IA », sur Les Echos, (consulté le ).
- Alexei Grinbaum, Raja Chatila, Laurence Devillers et Caroline Martin, « Systèmes d'intelligence artificielle générative : enjeux d'éthique », Comité national pilote d'éthique du numérique, (consulté le ).
- La Rédaction, « Intelligence artificielle (IA) générative : l'Autorité de la concurrence s'est autosaisie sur ce sujet majeur et lance une consultation publique », sur Science infuse site d'actualités, (consulté le ).
- « Intelligence artificielle générative : l’Autorité rend son avis sur le fonctionnement concurrentiel du secteur de l’intelligence artificielle générative », sur Autorité de la concurrence, (consulté le ).
- « L'Autorité de la concurrence alerte sur la domination américaine dans l'IA générative », sur www.banquedesterritoires.fr, (consulté le ).
- « Le rapporteur général de l'Autorité de la concurrence indique qu’une opération de visite et saisie inopinée a été réalisée dans le secteur des cartes graphiques », sur Autorité de la concurrence, (consulté le ).
- « IA : connaissez-vous Albert ? », sur info.gouv.fr,
- « Albert de la DINUM, l’IA française pour les fonctionnaires », sur bercynumerique.finances.gouv.fr,
- « Article L111-1 - Code de la propriété intellectuelle - Légifrance », sur www.legifrance.gouv.fr (consulté le )
- « MIT Technology Review »
- « The Guardian »
- « Bloomberg »
- « Nature »
- « OpenAI Blog »
- « Conseil Européen pour l’Innovation »