DeepSeek : l'IA générative chinoise qui bouscule ChatGPT d'OpenAi

  • deepseek-ia-generative-chinoise-bouscule-chatgpt-openai.jpeg

    DeepSeek-R1, le modèle d’IA à 5,6 millions de dollars, redistribue les cartes d’un marché dominé par les géants américains (DeepSeek).
  • Avec son modèle moins onéreux que ChatGPT, le modèle d’intelligence artificielle DeepSeek-R1, développé par une jeune start-up chinoise, s’attaque à la domination américaine malgré les restrictions technologiques.

    Le 20 janvier 2024, la start-up chinoise DeepSeek a frappé fort avec son dernier modèle d’intelligence artificielle (IA) générative DeepSeek-R1 : développée pour seulement 5,6 millions de dollars, un faible coût comparé à GPT-4 qui a nécessité 100 millions de dollars. 

    Malgré les restrictions américaines sur l’exportation de semi-conducteurs, DeepSeek a été créée en avril 2023 à Hangzhou, dans le bassin industriel chinois près de Shanghai, et s'est démarquée par ses capacités d’innovations. Depuis le lancement de DeepSeek-R1, les grandes entreprises de la tech accusent DeepSeek de leurs chutes en bourse. Le cours de Nvidia, fabricant américain de semi-conducteurs et première capitalisation mondiale, s’est effondré le 27 janvier et perdu 600 milliards de dollars en un jour.

    L’avantage technologique et économique de DeepSeek se fonde sur l’apprentissage par “renforcement” (un modèle qui tente par lui-même des solutions) et l'utilisation de nombres codés en 8 bits, ce qui limite le nombre de calculs et les coûts d’apprentissage. De plus, DeepSeek a rendu son code open source, ce qui permet à d'autres développeurs de le modifier et de l'utiliser, une pratique semblable à celles de Meta ou Mistral, pour leurs propres modèles.

    Lire aussi : Automatisation : aller encore plus loin avec l’IA générative

    Une IA concurrente sur un marché convoité 

    DeepSeek offre des fonctionnalités similaires à celles de ses concurrents occidentaux : la réponse à des questions de culture générale ou encore la rédaction de synthèse. Elle s’appuie sur un grand modèle de langage (LLM) et peut communiquer dans plusieurs langues, mais maîtrise surtout l'anglais et le chinois. 

    La concurrence fait rage avec l’arrivée de DeepSeek qui intervient peu de temps après l'annonce, par le président américain Donald Trump, du lancement du projet Stargate, destiné à développer l'IA aux États-Unis, avec un financement de 500 milliards de dollars. 
     

    À lire sur Archimag
    Les podcasts d'Archimag
    Pourquoi parle-t-on autant d’éthique quand il est question d’intelligence artificielle - et de quoi parle-t-on exactement ? Pour les Podcast d'Archimag, nous avons rencontré Enrico Panai, éthicien de l’intelligence artificielle. Avec lui, on clarifie ce que recouvre vraiment le mot "éthique" - au-delà des slogans - et pourquoi l’IA rend ces questions plus visibles, plus urgentes, et parfois plus confuses. On parlera aussi de l’entreprise : ses valeurs, ses contraintes, ses arbitrages… et de la manière dont une démarche éthique, quand elle intervient dès le départ, peut devenir un outil de décision et même un moteur d’innovation.
    Publicité

    Serda Formations Data 2026