Publicité

IA : OpenAI admet avoir besoin des œuvres protégées par le droit d'auteur pour entraîner ChatGPT

  • ia-openai-admet-avoir-besoin-oeuvres-protegees-par-droit-auteur-pour-entrainer-chatgpt.jpg

    IA-OpenAI-admet-avoir-besoin-œuvres-protegees-par-droit-auteur-pour-entrainer-ChatGPT
    Les œuvres soumises au droit d'auteur indispensables pour entraîner ChatGPT, admet OpenAI. (freepik/frimufilms)
  • Dans le cadre d’une enquête auprès de la Chambre des Lords du Royaume-Uni, OpenAI reconnaît que l'entraînement des meilleurs modèles d’intelligence artificielle (IA) actuels nécessite l'utilisation d'œuvres protégées par le droit d'auteur. 

    “Il serait impossible d’entraîner les meilleurs modèles d’intelligence artificielle (IA) d’aujourd’hui sans utiliser de documents protégés par le droit d’auteur”. C'est ce qu'affirme OpenAI, le créateur de ChatGPT, dans le cadre d'une enquête menée par la commission des communications et du numérique de la Chambre des Lords du Royaume-Uni sur les modèles de langage. Selon l'entreprise, "limiter les données d'entraînement aux livres et dessins du domaine public créés il y a plus d'un siècle pourrait donner lieu à une expérience intéressante, mais ne permettrait pas de fournir des systèmes d'IA répondant aux besoins des citoyens d'aujourd'hui"

    Or, depuis son lancement en novembre 2022, OpenAI n’a jamais publié la liste exhaustive des données utilisées pour entraîner ChatGPT, son système d'IA générative.

    Le “fair use” 

    Pour se défendre contre les nombreuses accusations actuelles d'utilisation frauduleuse de données, OpenAI assure “respecter les droits des créateurs et des propriétaires de contenu” concernant ceux qu'il utilise pour entraîner les modèles de langages (LLM). L'entreprise se cache derrière le principe de "fair use", un principe légal américain selon lequel certains contenus protégés par des droits d'auteur peuvent être utilisés dans certaines circonstances
    Rappelons qu’OpenAI fait l’objet de plusieurs actions en justice pour violation d'œuvres protégées par le droit d’auteur, dont notamment de la part du New York Times depuis le 27 décembre. 
     

    À lire sur Archimag
    Les podcasts d'Archimag
    Le Syndicat intercommunal d'énergies de Maine-et-Loire (SIÉML) s’est lancé dans un grand projet d’archivage électronique en 2023. L’opportunité de réduire l’impact carbone tout en optimisant les processus est apparue au cours du projet. Agnès Arendo, archiviste et déléguée à la protection des données du SIÉML, revient sur la mise en route et les grandes étapes de ce chantier.
    Publicité

    supplement-confiance-numerique-270500.png