Comme si l'actualité IA n'était pas assez chargée.. DeepSeek vient bousculer le game !
En quelques jours DeepSeek a réussi un tour de force: détourner l'attention internationale de l'annonce du gouvernement Trump à propos de son programme colossal StarGate, faire vasciller le cours du géant NVidia, et donner des sueurs froides à Sam Altman.
Voici un tour d'horizon de la question à travers la presse spécialisée française et internationale :
Qu'est-ce que DeepSeek ?
DeepSeek v3 est un énorme modèle de langage (LLM) développé et financé par High Flyer, qui permet le développement d'outils d'IA (codage, rédaction, analyse de documents...), mais pas encore la génération de contenu visuels ou videos.
Pourquoi son dernier modèle est-il révolutionnaire ?
La firme affirme avoir développé DeepSeek à une fraction du coût d'OpenAI, le principal leader du marché - voir cet article de Tech Target pour un comparatif technique et business des deux modèles (en anglais).
Une prouesse technologique d'autant plus intéressante que DeepSeek aurait réussi à contourner des contraintes techniques liées à l'usage de micro processeurs dernier cri développés principalement par NVidia, difficilement accessibles actuellement en Chine.
Si le modèle DeepSeek v3 utilise un modèle de langage (LLM pour les intimes) aux dimensions colossales (671 milliards de paramètres), les solutions adossées sur ce modèle, DeepSeek-R1-Distill par exemple, serait capable de rivaliser avec outils équivalents mais payants d'OpenAi tout en mobilisant beaucoup moins de ressources pour obtenir le même résultat.
Le parti pris de DeepSeek ? Offrir des modèles capables de répondre à des questions sur des verticaux spécifiques (comme la finance, ou la santé) plutôt que de viser à construire un outil capable de répondre à toutes les demandes (comme le font les modèle CoPilot, Gemini et ChatGPT3).
Grâce à un savant usage de différentes techniques, et notamment la technique de raisonnement (voir l'article de Tech Target pour plus de détails) l'équipe DeepSeek aurait réussi à pousser un champ jusqu'à présent considéré expérimental de l'Intelligence Artificielle Générale (IAG), et mettre à disposition un modèle utilisable par tous gratuitement, en Open Source, de quoi radicalement redéfinir un marché déjà en ébullition.
... Et en quoi DeepSeek ressemble aux autres éditeurs d'IA ?
Outre-Atlantique, son concurrent OpenAi (créateur des modèles ChatGPT) accuse DeepSeek avoir utilisé ses modèles, mais comme le souligne le Media PCGamer, on est aussi face à un cas classique de l'arroseur arrosé, avec Sam Altman, PDG d'OpenAi, qui accuse DeepSeek d'avoir utilisé les données... qu'il a lui même collecté de manière douteuse.
Et comme ses compétiteurs, DeepSeek a exploité des techniciens d'annotation et modération pour affiner ses modèle dans des pays en voie de développement, comme au Kenya. Une piqûre de rappel que la création des modèles d'IA n'est pas sans incidence humaine et environnementale (en savoir plus si le sujet vous intéresse).
Quels sont les risques ?
Puisque DeepSeek héberge les données collectées sur des serveurs en Chine, cela pose des problèmes de protection de données, et la CNIL s'est d'ores et déjà saisie du sujet, comme nos voisins italiens et irlandais.
Si on entrevoit une amélioration de la performance énergétique
avec ces nouveaux modèles, il ne faut pas pour autant déduire qu'on verra une
réduction de l'empreinte environnementale de l'IA - attention à l'effet
rebond !
Enfin, il est important de rappeller que les principales raisons pour lesquel un projet d'IA en entreprise échoue viennent de notre difficulté, en tant qu'humains, à correctement définir le problème à résoudre et communiquer correctement tout au long du développement. Ces limites persistent donc, qu'importe les innovations technologiques.
Quelles implications pour le marché de l'IA ?
Ces disruptions technologiques vont affecter le marché des investisseurs, des producteurs, mais également le contexte réglementaire de nombreux pays. La révolution DeepSeek ouvre aussi la voix à une tendance de plus en plus séduisante pour les entreprises, à savoir les Small Language Models (SLM).
D'ailleurs, les principaux acteurs déjà en place (Meta, Hugging Face...) se sont déjà lancés dans un processus de duplication pour créer des clones fonctionnels du modèle de DeepSeek, qui seront théoriquement plus sécuritaires.
Le temps que nous finissions d'écrire ce billet, de nouvelles informations et de nouveaux modèles, ainsi que le calcul de leur impacts et la mesure de leur efficacité auront vu le jour. La veille reste essentielle, d'autant plus qu'il est encore trop tôt pour voir si ces nouveaux modèles font mieux que leur précédesseurs en termes de réplicabilité et d'explicabilité. Bref, à suivre de près !
Envie de creuser l'impact et les bénéfices de IA dans votre métier ?
Rejoignez nos clubs adhérents pour explorer et progresser entre pairs, plusieurs d'entre eux vont aborder l'IA : Numérique Responsable, Cyber, Produit, Tech4Tech...
Le saviez-vous ? L'IA fait partie des trois piliers
Le saviez-vous ?
Minasmart accompagne les petites et moyennes entreprises de la région Auvergne-Rhône-Alpes dans leur démarche de transformation et d’innovation numérique et notamment en intelligence artificielle, cybersécurité et simulation haute performance.
