Publicité

DeepSeek : l'IA générative chinoise qui bouscule ChatGPT d'OpenAi

  • deepseek-ia-generative-chinoise-bouscule-chatgpt-openai.jpeg

    DeepSeek-R1, le modèle d’IA à 5,6 millions de dollars, redistribue les cartes d’un marché dominé par les géants américains (DeepSeek).
  • Avec son modèle moins onéreux que ChatGPT, le modèle d’intelligence artificielle DeepSeek-R1, développé par une jeune start-up chinoise, s’attaque à la domination américaine malgré les restrictions technologiques.

    Le 20 janvier 2024, la start-up chinoise DeepSeek a frappé fort avec son dernier modèle d’intelligence artificielle (IA) générative DeepSeek-R1 : développée pour seulement 5,6 millions de dollars, un faible coût comparé à GPT-4 qui a nécessité 100 millions de dollars. 

    Malgré les restrictions américaines sur l’exportation de semi-conducteurs, DeepSeek a été créée en avril 2023 à Hangzhou, dans le bassin industriel chinois près de Shanghai, et s'est démarquée par ses capacités d’innovations. Depuis le lancement de DeepSeek-R1, les grandes entreprises de la tech accusent DeepSeek de leurs chutes en bourse. Le cours de Nvidia, fabricant américain de semi-conducteurs et première capitalisation mondiale, s’est effondré le 27 janvier et perdu 600 milliards de dollars en un jour.

    L’avantage technologique et économique de DeepSeek se fonde sur l’apprentissage par “renforcement” (un modèle qui tente par lui-même des solutions) et l'utilisation de nombres codés en 8 bits, ce qui limite le nombre de calculs et les coûts d’apprentissage. De plus, DeepSeek a rendu son code open source, ce qui permet à d'autres développeurs de le modifier et de l'utiliser, une pratique semblable à celles de Meta ou Mistral, pour leurs propres modèles.

    Lire aussi : Automatisation : aller encore plus loin avec l’IA générative

    Une IA concurrente sur un marché convoité 

    DeepSeek offre des fonctionnalités similaires à celles de ses concurrents occidentaux : la réponse à des questions de culture générale ou encore la rédaction de synthèse. Elle s’appuie sur un grand modèle de langage (LLM) et peut communiquer dans plusieurs langues, mais maîtrise surtout l'anglais et le chinois. 

    La concurrence fait rage avec l’arrivée de DeepSeek qui intervient peu de temps après l'annonce, par le président américain Donald Trump, du lancement du projet Stargate, destiné à développer l'IA aux États-Unis, avec un financement de 500 milliards de dollars. 
     

    À lire sur Archimag
    Les podcasts d'Archimag
    La photographie possède un pouvoir fascinant : celui de capturer un instant et de le figer pour l’éternité. Elle raconte des histoires, qu’elles soient personnelles ou collectives, qui traversent le temps et façonnent notre passé, notre présent et notre futur. C’est pourquoi les albums de famille jouent un rôle si important dans la construction de nos souvenirs. Mais avec l’avènement de l’intelligence artificielle générative, capable de créer des images de plus en plus proches de la réalité, une question se pose : comment cette technologie va-t-elle influencer notre mythologie familiale ? Serge Tisseron, psychiatre et docteur en psychologie, explore depuis longtemps nos relations avec les technologies. En cherchant à recréer une photographie de son enfance, il s’est intéressé aux liens entre mémoire, photographie et intelligence artificielle. Il revient sur l’origine de son livre "Le jour où j’ai tué mon frère - Quand l’IA fabrique la photographie de nos souvenirs", publié aux Éditions Lamaindonne.
    Publicité

    Serda Formations Data 2023