Développée par une startup basée à Hangzhou, DeepSeek fait sensation en rivalisant avec des géants américains tels que ChatGPT. Dès son lancement, cette IA chinoise a prouvé sa capacité à égaler, voire même à surpasser les LLM occidentaux en termes de performance.
Dans cet article, voyons ensemble comment celle-ci a réussi à déstabiliser la Silicon Valley et à remettre en question la domination de ChatGPT.
Sommaire
Qu’est-ce que DeepSeek ?
DeepSeek est un modèle d’IA chinoise fabriquée par une entreprise du même nom. Elle est conçue pour répondre à vos questions et améliorer votre vie de manière efficace. Elle a rapidement impressionné les spécialistes de l’IA et s’est même hissée au sommet des téléchargements de l’Apple Store. Conséquence, certaines valeurs technologiques ont chuté.
À la différence des autres agents conversationnels du marché, le modèle d’intelligence artificielle qui l’alimente compte quelque 670 milliards de paramètres, ce qui en fait d’elle, le plus grand modèle de langage à code source ouvert à ce jour. D’ailleurs, en matière de mathématiques, de codage et de raisonnement, ce dernier est aussi puissant que le modèle o1 d’OpenAI qui alimente ChatGPT.
DeepSeek propose plusieurs modèles de langages, notamment des langages spécialisés tels que DeepSeek LLM, DeepSeek Coder, DeepSeek Math, DeepSeek VL, DeepSeek V2, DeepSeek Coder V2, DeepSeek V3 et plus récente le modèle R1. Toutefois, depuis la fin de l’année 2024, deux modèles sont les plus populaires :
- Le modèle V3 : le modèle polyvalent universel qui est similaire à ce que ChatGPT propose par défaut avec GPT 4o. C’est un modèle qui peut générer du texte, analyser et résumer de longs documents et qui peut discuter avec vous.
- Le modèle R1 : équivalent du modèle O1 de ChatGPT, celui-ci est un modèle avant-garde conçu pour répondre à des problématiques plus compliquées en posant différentes hypothèses.
Une IA low-cost mais efficace
Contrairement aux IA comme ChatGPT, DeepSeek est plutôt surprenante, car développée avec un budget bien inférieur à celui utilisé par ses concurrents américains, celle-ci est tout aussi performante. Cela résulte de son architecture plus légère et une optimisation intelligente de ses ressources. Pour information, pour développer son modèle, DeepSeek n’a dépensé qu’un budget dérisoire de 5,6 millions de dollars contre des milliards de dollars pour les entreprises d’IA aux États-Unis.
En effet, grâce à des méthodes novatrices telles que le Mixture-of-experts et le Multi-head Latent Attention ou MLA, le modèle de DeepSeek a nécessité dix fois moins de ressources matérielles que ses rivaux américains, réduisant ainsi les besoins en calculs massifs.
DeepSeek bouleverse les marchés financiers
Il faut dire que le modèle d’intelligence artificielle DeepSeek pourrait bien secouer le modèle économique du secteur. En quelques jours seulement après son lancement, cette IA s’est imposée comme une alternative crédible et économique, attirant l’attention d’une industrie habituée aux géants américains.
En conséquence, les actions des grandes entreprises technologiques américaines comme Nvidia ont chuté de 17 % en une journée, effaçant près de 590 milliards de dollars de sa valeur boursière. Les titres de Microsoft et d’Amazon, eux, ont aussi reculé. Qui plus est, même les entreprises liées au projet « Stargate », un projet de 500 milliards de dollars pour développer des infrastructures IA, ont subi des pertes significatives.
DeepSeek : quels sont ses atouts ?
Si DeepSeek est autant plébiscité pour ses performances, cette IA a plus d’une carte en main pour concurrencer les mastodontes américains. Elle se distingue par plusieurs atouts clés qui la placent en compétition directe avec ChatGPT.
Une révolution open source
L’une des principales raisons pour lesquelles DeepSeek attire autant d’attention est son caractère open source. Cette philosophie s’oppose en effet avec les approches fermées des géants américains.
En rendant publiques les innovations de ses modèles, cette IA incite les chercheurs à publier ce qu’ils découvrent sur internet et à collaborer avec les chercheurs du monde entier. En outre, cela permet aux développeurs d’explorer, de modifier et d’améliorer l’algorithme, accélérant ainsi son développement.
Grâce à cela, DeepSeek pourra élargir son écosystème, mais surtout compenser son retard technologique face à ses concurrents. Il est indéniable que ce qui rend DeepSeek fascinant, c’est sa capacité à combiner l’efficience d’un modèle open source avec une rapidité de calcul en temps réel et une performance hors du commun.
Des réponses rapides et précises
L’une des caractéristiques les plus remarquées de DeepSeek est la rapidité avec laquelle elle génère des réponses. Certes, quelques secondes lui suffisent pour répondre à des questions complexes. Cette IA surpasse donc ses concurrents en termes de temps de réponse, ce qui est essentiel pour les utilisateurs cherchant à obtenir des informations dans des délais serrés.
De plus, DeepSeek fournit des réponses justes et précises à diverses requêtes. Une précision à 8 décimales près contre 32 décimales chez les concurrents, qui vont donner des précisions très bonnes pour des résultats qui coûtent énormément moins d’argent. Elle n’est d’ailleurs pas tombée dans le panneau du classique « quel est le plus nourrissant : le lait de crocodile ou le lait de moineau ? », car cette IA a clairement indiqué que ces deux liquides n’existent pas et une comparaison serait impossible.
Un prix moindre par rapport à ses concurrents
Le coût d’utilisation est également un des principaux atouts de DeepSeek. Pour seulement 0,28 dollar par million de tokens en entrée, cette IA vous permet d’accéder à son modèle de langage avancé DeepSeek V3. Ce prix est près de 20 fois moins cher que GPT-4o d’OpenAi qui vous facture 2,50 dollars pour le même volume.
Une présentation agréable de ses réponses
L’un des aspects les plus appréciés de DeepSeek, c’est la manière dont les réponses sont présentées, et ce, quelle que soit la requête formulée. Entre des paragraphes bien structurés, des listes à puces et émojis, des phrases simples et efficaces, la lecture est plutôt agréable et fluide.
DeepSeek : des performances impressionnantes, mais des limites inquiétantes
Bien qu’elle soit au top de la performance, DeepSeek, présente quelques limites. Elle se montre moins efficace dans des domaines créatifs comme la rédaction de poèmes ou la génération d’histoires. Pire encore, il n’est pas en mesure de traiter des questions sensibles liées à la Chine, en raison de la censure du gouvernement chinois.
L’approche open source de DeepSeek peut également soulever des préoccupations en matière de sécurité et de confidentialité des données, notamment en ce qui concerne la protection de la propriété intellectuelle et des informations sensibles.
Il existe cependant une solution pour avoir sur la confidentialité de vos données, c’est d’installer DeepSeek sur votre PC ou mac en local. Je vous ai d’ailleurs fait tutoriel vidéo si ça vous intéresse :
De par ses performances, DeepSeek représente un défi majeur pour l’hégémonie de ChatGPT et pour la domination américaine dans le domaine de l’intelligence artificielle. Cette IA chinoise a non seulement démontré son potentiel à rivaliser avec les meilleurs, mais elle a également remis en question les modèles de développement traditionnels de l’IA. Elle montre en effet qu’il est possible d’innover avec des ressources limitées. Alors que la compétition dans le domaine de l’IA s’intensifie, DeepSeek continuera de jouer un rôle important dans la redéfinition du paysage technologique mondial. Toutefois, il reste à voir comment celle-ci va évoluer et comment elle va influencer l’avenir de l’intelligence artificielle.