DeepSeek : l'IA générative chinoise qui bouscule ChatGPT d'OpenAi

  • deepseek-ia-generative-chinoise-bouscule-chatgpt-openai.jpeg

    DeepSeek-R1, le modèle d’IA à 5,6 millions de dollars, redistribue les cartes d’un marché dominé par les géants américains (DeepSeek).
  • Avec son modèle moins onéreux que ChatGPT, le modèle d’intelligence artificielle DeepSeek-R1, développé par une jeune start-up chinoise, s’attaque à la domination américaine malgré les restrictions technologiques.

    Le 20 janvier 2024, la start-up chinoise DeepSeek a frappé fort avec son dernier modèle d’intelligence artificielle (IA) générative DeepSeek-R1 : développée pour seulement 5,6 millions de dollars, un faible coût comparé à GPT-4 qui a nécessité 100 millions de dollars. 

    Malgré les restrictions américaines sur l’exportation de semi-conducteurs, DeepSeek a été créée en avril 2023 à Hangzhou, dans le bassin industriel chinois près de Shanghai, et s'est démarquée par ses capacités d’innovations. Depuis le lancement de DeepSeek-R1, les grandes entreprises de la tech accusent DeepSeek de leurs chutes en bourse. Le cours de Nvidia, fabricant américain de semi-conducteurs et première capitalisation mondiale, s’est effondré le 27 janvier et perdu 600 milliards de dollars en un jour.

    L’avantage technologique et économique de DeepSeek se fonde sur l’apprentissage par “renforcement” (un modèle qui tente par lui-même des solutions) et l'utilisation de nombres codés en 8 bits, ce qui limite le nombre de calculs et les coûts d’apprentissage. De plus, DeepSeek a rendu son code open source, ce qui permet à d'autres développeurs de le modifier et de l'utiliser, une pratique semblable à celles de Meta ou Mistral, pour leurs propres modèles.

    Lire aussi : Automatisation : aller encore plus loin avec l’IA générative

    Une IA concurrente sur un marché convoité 

    DeepSeek offre des fonctionnalités similaires à celles de ses concurrents occidentaux : la réponse à des questions de culture générale ou encore la rédaction de synthèse. Elle s’appuie sur un grand modèle de langage (LLM) et peut communiquer dans plusieurs langues, mais maîtrise surtout l'anglais et le chinois. 

    La concurrence fait rage avec l’arrivée de DeepSeek qui intervient peu de temps après l'annonce, par le président américain Donald Trump, du lancement du projet Stargate, destiné à développer l'IA aux États-Unis, avec un financement de 500 milliards de dollars. 
     

    À lire sur Archimag
    Les podcasts d'Archimag
    Êtes-vous prêt pour la réforme de la facturation électronique ? À moins de 460 jours du grand lancement, l’écosystème se prépare activement. Lors de la Journée de la Facturation Électronique qui s'est tenue le 13 mai dernier à Paris, Archimag Podcast est allé à la rencontre des acteurs incontournables de cette réforme : les Plateformes de dématérialisation partenaires, ou PDP. Ensemble, nous avons parlé de leur rôle, de leurs spécificités, de leur modèle économique et de leur secret de longévité. Dans cet épisode, nous vous dévoilons qui sont ces acteurs et ce qu'ils préparent pour accompagner la réforme.

    Serda Formations Data 2023