Catégories
En vedette Entreprises Interviews experts

Zaion acquiert Dydu et accélère sa stratégie dans l’IA agentique

À quelques mois d’une nouvelle phase d’accélération du marché de l’intelligence artificielle appliquée à la relation client, Zaion annonce l’acquisition de Dydu, spécialiste des agents conversationnels.

Premier constat : les attentes du marché ont profondément évolué. Les entreprises ne se contentent plus d’automatiser quelques interactions, elles cherchent désormais à unifier l’ensemble de leur relation client, quel que soit le canal utilisé.

L’intégration de Dydu permet à Zaion d’élargir sa plateforme et de couvrir à la fois les interactions vocales, les échanges écrits via le web ou les messageries, ainsi que les environnements mobiles. Cette convergence répond à un besoin clé : simplifier des écosystèmes souvent fragmentés et offrir une expérience cohérente aux utilisateurs. L’enjeu n’est donc plus uniquement technologique, mais organisationnel.

Une étape structurante dans la croissance de Zaion

Au-delà de la complémentarité technologique, cette acquisition marque un véritable changement d’échelle pour Zaion. L’entreprise franchit un cap avec un chiffre d’affaires récurrent combiné dépassant les 10 millions d’euros, seuil stratégique pour une plateforme B2B à forte intensité technologique.

Cette nouvelle dimension s’accompagne d’un portefeuille d’une centaine de clients et d’une équipe d’environ cent experts. Elle ouvre également la voie à des synergies commerciales et produit, notamment via la vente croisée des solutions et l’accélération des déploiements à grande échelle. Dans cette dynamique, Zaion affiche une ambition claire : atteindre la rentabilité d’ici l’été 2026 tout en renforçant sa position sur le marché européen.

L’un des apports majeurs de cette opération réside dans la complémentarité des expertises. D’un côté, Zaion s’est historiquement imposé sur le canal vocal et les environnements critiques. De l’autre, Dydu a développé un savoir-faire reconnu dans les agents conversationnels écrits et les outils no-code.

Le rapprochement des deux entités permet aujourd’hui de proposer une plateforme unifiée, capable de gérer l’ensemble des interactions client au sein d’une architecture cohérente. Cette unification facilite le déploiement, améliore la lisibilité des parcours utilisateurs et simplifie le pilotage des dispositifs de relation client.

Une approche industrielle de l’IA agentique

Au-delà de l’annonce, Zaion défend une vision spécifique de l’intelligence artificielle. Contrairement à une approche centrée uniquement sur la puissance des modèles de langage, l’entreprise met en avant l’importance de l’orchestration.

La performance repose ici sur la capacité à combiner différentes briques technologiques, en mobilisant les bons modèles selon les cas d’usage. Cette approche hybride permet d’optimiser les performances tout en maîtrisant les coûts, mais aussi d’améliorer l’expérience utilisateur et de garantir une meilleure gestion des données. L’IA devient ainsi un système organisé et industrialisé, plutôt qu’un simple outil expérimental.

Dans un contexte de dépendance croissante aux technologies étrangères, la souveraineté s’impose comme un critère déterminant pour les grandes entreprises, en particulier dans les secteurs régulés.

Zaion s’inscrit pleinement dans cette dynamique en proposant des solutions développées et opérées en France, avec une maîtrise de ses choix technologiques et une attention particulière portée à la sécurité des données. Le soutien d’investisseurs tels que 115K, PRO BTP, Fortino Capital et Truffle Capital vient renforcer la crédibilité de ce positionnement et soutenir l’émergence d’un acteur européen de référence.

Une transformation en profondeur de la relation client

Cette acquisition illustre une évolution plus large du marché : le passage d’une IA expérimentale à une IA véritablement opérationnelle. L’automatisation des demandes simples permet de recentrer l’intervention humaine sur les situations complexes, améliorant à la fois l’efficacité et la qualité de service.

Ce modèle hybride transforme en profondeur la relation client, en apportant plus de fluidité, une meilleure gestion des volumes et une optimisation des coûts. Il ne s’agit plus seulement d’innover, mais de structurer durablement les opérations.

Si l’IA agentique peut encore sembler technique, elle constitue surtout un levier de transformation pour les entreprises. En unifiant leurs outils et en automatisant une partie de leurs interactions, elles peuvent gagner en productivité, améliorer l’expérience client et renforcer la sécurité de leurs données.

Pour Zaion, cette acquisition ne se limite donc pas à une opération de croissance externe. Elle s’inscrit dans une ambition plus large : faire de l’IA un outil concret, fiable et pleinement intégré aux enjeux métiers.

Une étape supplémentaire vers une relation client plus intelligente, plus fluide et mieux maîtrisée.

Franz Fodéré, Président-Fondateur de Zaion, et Mathieu Changeat, Co-Fondateur de Dydu, reviennent sur les enjeux et les ambitions de leur rapprochement

« L’acquisition de Dydu constitue une étape décisive dans notre stratégie. Elle nous permet de franchir un cap majeur en proposant une plateforme d’IA agentique véritablement multicanale, aux standards des grandes entreprises. En combinant nos expertises, nous renforçons notre capacité à accompagner les grandes organisations dans l’industrialisation de l’IA agentique, avec des exigences fortes de sécurité, conformité et souveraineté. Notre approche reste guidée par une conviction : automatiser sans déshumaniser, en plaçant l’humain au cœur de la transformation de la Relation Client. »


Amaury Lelong, Directeur Général de Zaion :


« Porté par l’essor de l’IA agentique et les enjeux de souveraineté, le marché attend des solutions conçues et opérées en Europe, couvrant le maximum de cas d’usage et s’appuyant sur un large éventail de briques technologiques, sans compromis sur la performance, la sécurité et la sobriété. Le rapprochement entre Zaion et Dydu répond à cette attente en
combinant profondeur technologique et capacité d’industrialisation. »


Mathieu Changeat, Co-Fondateur de Dydu :


« Ce rapprochement est une formidable opportunité de créer des synergies immédiates. En intégrant les innovations du Lab Zaion à notre produit, nous décuplons ses capacités tout en préservant nos engagements fondamentaux de souveraineté et de sobriété numérique. L’alliance de nos technologies étend considérablement le champ des possibles pour nos
projets respectifs. La réunion de nos équipes forme un collectif élargi, doté de compétences hautement complémentaires, pour offrir un accompagnement d’excellence à l’ensemble de nos clients. »


À propos de Zaion


Zaion est le spécialiste français de l’IA agentique pour la Relation Client.
Sa mission : aider les entreprises à optimiser leurs interactions clients grâce à une technologie spécialisée et souveraine. Sa plateforme, conçue pour les environnements critiques des grandes entreprises, permet d’automatiser les interactions clients et d’assister les conseillers en temps réel, avec un haut
niveau d’exigence en matière de sécurité, de conformité et de performance.
Site web : www.zaion.ai


À propos de Dydu


Depuis 2009, Dydu propose une plateforme intuitive à destination des professionnels pour concevoir en toute autonomie des agents conversationnels intelligents : chatbot, voicebot, callbot. Ses solutions s’appuient sur la compréhension du langage naturel et l’intelligence artificielle pour alléger le quotidien des équipes tout en améliorant la satisfaction des utilisateurs. Dydu compte parmi ses clients de nombreuses entreprises du CAC 40 et du SBF 120.

Catégories
Actualité Banque & Finance Bourse En vedette Entreprises Investissement & Stratégies

NVIDIA : des résultats très attendus ce soir, un test pour la vague IA

Ce mercredi 27 août 2025, après la clôture de Wall Street, NVIDIA publiera ses résultats du deuxième trimestre fiscal 2026. La société, devenue l’icône de l’intelligence artificielle générative et de l’informatique haute performance, est scrutée de près par les marchés.

Sa performance constitue un baromètre pour l’ensemble du secteur technologique.

Des attentes colossales

Le consensus des analystes table sur un chiffre d’affaires de l’ordre de 46 milliards de dollars, en hausse d’environ 53 % sur un an. Le bénéfice par action ajusté (EPS) est attendu autour de 1,01 à 1,02 dollar, soit une progression de près de 49 %.

Ces prévisions, déjà impressionnantes, reflètent l’énorme demande mondiale en processeurs graphiques (GPU) utilisés dans l’IA, le cloud et les supercalculateurs.

Trois enjeux majeurs

  1. La division Data Centers Segment désormais dominant (plus de 80 % du chiffre d’affaires), il reste la locomotive de la croissance. Le marché attend confirmation que la demande en IA ne faiblit pas.
  2. Les tensions États-Unis / Chine Washington a renforcé les restrictions sur les exportations de puces avancées. NVIDIA a dû suspendre la production de son modèle H20 en Chine et mettre en place un accord de partage de revenus (15 %) sur ses ventes locales. L’impact sur les résultats asiatiques sera très surveillé.
  3. La guidance pour le prochain trimestre Les investisseurs veulent savoir si NVIDIA maintiendra son rythme de croissance. Les annonces autour de la nouvelle génération de puces (Rubin et modèles adaptés au marché chinois) pourraient être décisives.

Pourquoi c’est un test pour la vague IA

La capitalisation boursière de NVIDIA dépasse désormais 4 000 milliards de dollars. À ce niveau, le moindre signe de ralentissement pourrait peser lourdement sur l’ensemble du Nasdaq et du secteur technologique.

Si les résultats et les prévisions confirment une dynamique forte, cela prolongera l’euphorie actuelle autour de l’intelligence artificielle. À l’inverse, un chiffre en deçà des attentes pourrait nourrir le doute sur la viabilité à court terme de cette révolution, certains observateurs rappelant que 95 % des entreprises n’ont pas encore dégagé de bénéfices tangibles de leurs investissements IA.

Conclusion

Les résultats de ce soir ne sont pas seulement ceux de NVIDIA : ils incarneront l’arbitrage du marché sur l’avenir de l’IA. Le verdict attendu après la clôture de Wall Street pourrait bien dicter la tendance de l’automne pour l’ensemble des marchés financiers.

Catégories
Entreprises Nos analyses

DeepSeek, le ChatGPT chinois qui fait trembler les américains

Selon Alexandr Wang , 28 ans, fondateur et PDG de Scale AI , une start-up de 13 milliards de dollars, les États-Unis ont maintenu leur domination sur la Chine en matière d’intelligence artificielle pendant près d’une décennie.

Mais avec la sortie à Noël d’un modèle d’intelligence artificielle « révolutionnaire » de la start-up chinoise DeepSeek fondé par le gérant de hedge fund Liang Wenfeng, l’écart entre les deux pays se réduit dangereusement, a déclaré Wang dans une interview accordée à CNBC le 23 janvier 2025.

En effet, plus tôt cette semaine, DeepSeek a publié un deuxième modèle d’intelligence artificielle (IA) qui démontre des capacités de raisonnement rivalisant avec celles des grandes entreprises américaines comme OpenAI.

En plus d’impressionner les chercheurs par ses performances, les progrès rapides de la start-up chinoise ont soulevé des questions sur l’efficacité des contrôles à l’exportation des puces d’IA destinés à limiter l’accès de la Chine aux unités de traitement graphique avancées (GPU) qui sous-tendent les outils d’IA.

Scale AI s’est également récemment associé au Center for AI Safety pour lancer « Humanity’s Last Exam », qu’ils décrivent comme le test de référence le plus difficile à ce jour pour les systèmes d’IA. Bien qu’aucun modèle n’ait réussi à obtenir plus de 10 % au test jusqu’à présent, Wang a déclaré que le nouveau modèle de raisonnement de DeepSeek, DeepSeek-R1, était en tête du classement. « Leur modèle est en fait le plus performant, ou à peu près au même niveau que les meilleurs modèles américains », a-t-il déclaré à CNBC.

DeepSeek affirme que R1 est proche ou meilleur que les modèles concurrents dans plusieurs tests de référence de premier plan tels que AIME 2024 pour les tâches mathématiques, MMLU pour les connaissances générales et AlpacaEval 2.0 pour les performances aux questions-réponses. Il se classe également parmi les meilleurs sur un classement affilié à l’UC Berkeley appelé Chatbot Arena.

Ces réalisations couvrent divers domaines de référence, notamment la résolution de problèmes complexes, les mathématiques et le codage, positionnant DeepSeek comme un acteur clé sur la scène mondiale de l’IA.

Sauf que DeepSeek n’est pas un cas isolé. Depuis le milieu de l’année dernière, les entreprises technologiques chinoises telles qu’Alibaba, Tencent, ByteDance, Moonshot et 01.ai ont progressivement réduit l’écart avec leurs homologues américaines, en égalant leurs capacités et en les surpassant en termes de rentabilité.

De fait, DeepSeek n’est pas le seul à s’implanter en Chine. ByteDance prévoit de dépenser plus de 12 milliards de dollars en infrastructures d’IA aux États-Unis cette année, dans le cadre d’ un investissement plus important de 20 milliards de dollars , dont la moitié sera consacrée aux centres de données et aux équipements.

Huawei se positionne également comme un acteur clé , compte tenu du défi que représente l’obtention de la technologie Nvidia et des nouvelles restrictions américaines. Il y a aussi le nouveau fonds d’investissement chinois dans l’IA, doté de 8 milliards de dollars de capital initial , dans le but de soutenir le pays après le renforcement des contrôles à l’exportation des semi-conducteurs avancés et d’autres technologies par les États-Unis.

Les progrès réalisés par la Chine en matière d’efficacité énergétique ne sont pas le fruit du hasard. Ils sont une réponse directe aux restrictions d’exportation de plus en plus strictes imposées par les États-Unis et leurs alliés. En limitant l’accès de la Chine aux puces d’intelligence artificielle avancées, les États-Unis ont par inadvertance stimulé son innovation.

Pour réduire leur dépendance aux puces haut de gamme étrangères, les entreprises chinoises d’IA ont expérimenté de nouvelles approches en matière d’algorithmes, d’architecture et de stratégies de formation.

Nombre d’entre elles ont adopté une approche « mixte d’experts », en se concentrant sur des modèles d’IA plus petits, formés à partir de données spécifiques. Ces modèles peuvent fournir des résultats puissants tout en réduisant les ressources informatiques.

DeepSeek-V3 incarne le succès de cette approche ingénieuse. Selon son rapport technique, le modèle a été entraîné à l’aide d’un centre de données alimenté par des GPU Nvidia H800, une puce moins avancée que les dernières versions de Nvidia.

Cependant, le PDG de Scale AI, Alexandr Wang, affirme que DeepSeek déforme ses affirmations selon lesquelles il n’utilise que 2 048 GPU Nvidia ; il a déclaré que le nombre est d’environ 50 000. Il explique que la principale raison pour laquelle ils agissent ainsi est qu’ils ne veulent pas admettre qu’ils obtiennent les puces malgré la restriction américaine.

Bien que personne ne puisse vraiment le savoir avec certitude sur la base du document technique qu’ils ont publié sur leurs derniers modèles, V3 et R1, il semble plausible qu’ils aient considérablement réduit le besoin de calcul d’entraînement.

Par ailleurs, de nombreux observateurs chinois ont salué DeepSeek-R1 comme un triomphe national et un paradigme de l’innovation chinoise. En effet, les chercheurs et ingénieurs chinois excellent dans la réalisation d’objectifs ambitieux de manière efficace et rentable, en innovant souvent dans des méthodes techniques malgré des contraintes de ressources.

La dépendance minimale de DeepSeek-V3 à l’égard du calcul haute performance, son approche systématique de la formation et de l’inférence et ses solutions techniques innovantes reflètent l’état d’esprit technique qui caractérise les entreprises, les équipes et les chercheurs chinois.

En outre, la dernière version de DeepSeek a terminé sa formation en seulement deux mois pour un coût de 5,5 millions de dollars, une fraction des sommes dépensées par des entreprises américaines comme OpenAI.

De fait, DeepSeek a affirmé avoir utilisé seulement 2 048 Nvidia H800 et 5,6 millions de dollars pour former un modèle avec 671 milliards de paramètres, soit environ 1,6 fois la taille du Llama 3.1, considéré comme le meilleur modèle open source américain. Ainsi l’entreprise a dépensé une fraction de ce qu’OpenAI et Google ont dépensé pour former des modèles de taille comparable.

Les plus grandes entreprises d’intelligence artificielle du monde entraînent leurs chatbots à l’aide de supercalculateurs qui utilisent jusqu’à 16 000 puces, voire plus. Les ingénieurs de DeepSeek, de leur côté, ont déclaré qu’ils n’avaient besoin que d’environ 2 000 puces informatiques spécialisées de Nvidia.

Ainsi, la façon la plus simple de comprendre ces changements est de dire que DeepSeek a pris le modèle de frontière d’OpenAI et l’a utilisé comme enseignant pour son modèle. Avec cela, ils ont distillé le modèle en un modèle plus petit tout en conservant presque toutes ses performances intactes. Comme le modèle est plus petit et grâce à d’autres innovations, ils ont considérablement réduit le coût de sa formation et de son fonctionnement.

L’une de leurs innovations importantes concernait l’attention latente multi-têtes (MLA). Plus précisément, ils se sont concentrés sur les aspects d’équilibrage de charge. Pour le dire de la manière la plus simple, l’essentiel est que le modèle n’a pas toujours besoin de stocker tous les paramètres dont il dispose, mais se concentre uniquement sur les plus importants.

Ils ont fait cela sans aucune dégradation des performances qui accompagne généralement l’équilibrage de charge. Ils acheminent essentiellement les demandes d’inférence vers un modèle plus petit, le plus à même de répondre à la requête ou de résoudre la tâche.

Considérez-le comme ayant plusieurs « têtes d’attention » qui peuvent se concentrer sur différentes parties des données d’entrée, permettant au modèle de capturer une compréhension plus complète des informations. Ce mécanisme d’attention amélioré contribue aux performances impressionnantes de DeepSeek-V3 sur divers tests.

En outre, Les modèles de DeepSeek utilisent une architecture MoE, activant seulement une petite fraction de leurs paramètres pour une tâche donnée. Cette

Cette activation sélective réduit considérablement les coûts de calcul et améliore l’efficacité. Imaginez une équipe d’experts, chacun spécialisé dans un domaine différent. Face à une tâche, seuls les experts concernés sont sollicités, garantissant une utilisation efficace des ressources et de l’expertise. L’architecture MoE de DeepSeek fonctionne de manière similaire, activant uniquement les paramètres nécessaires pour chaque tâche, ce qui entraîne des économies de coûts importantes et une amélioration des performances.

En plus de cela, avec la sortie complète de R1 lundi et le document technique qui l’accompagne , la société a révélé une innovation surprenante : un écart délibéré par rapport au processus conventionnel de réglage fin supervisé (SFT) largement utilisé dans la formation de grands modèles linguistiques (LLM).

La SFT, une étape standard du développement de l’IA, consiste à entraîner des modèles sur des ensembles de données organisés pour enseigner le raisonnement étape par étape, souvent appelé chaîne de pensée (CoT). Elle est considérée comme essentielle pour améliorer les capacités de raisonnement.

Cependant, DeepSeek a remis en question cette hypothèse en ignorant complètement la SFT, choisissant plutôt de s’appuyer sur l’apprentissage par renforcement (RL) pour entraîner le modèle.

Surnommée « DeepSeek-R1-Zero », cette première version du modèle a appris le raisonnement par chaîne de pensée uniquement à partir de retours d’information par essais et erreurs, sans aucune instruction supervisée pour la guider. En poussant le modèle à résoudre des tâches toujours plus complexes, le RL a inculqué des capacités telles que l’autoréflexion et la vérification.

L’inconvénient ? Le résultat manquait de finition : DeepSeek-R1-Zero était sujet à la répétition, à un mélange étrange de langues et à un texte peu maniable.

Pour l’affiner, l’équipe a superposé un processus en plusieurs étapes combinant le RL avec un réglage fin supervisé traditionnel. Le R1 qui en résulte est un système qui non seulement correspond au produit phare d’OpenAI en matière de références mathématiques, de codage et de logique, mais fournit également des résultats à une fraction du coût.

Cette démarche audacieuse a obligé DeepSeek-R1 à développer des capacités de raisonnement indépendantes, évitant la fragilité souvent introduite par les ensembles de données prescriptifs. Bien que certaines failles apparaissent, ​​conduisant l’équipe à réintroduire une quantité limitée de SFT lors des dernières étapes de construction du modèle, les résultats ont confirmé une avancée fondamentale : l’apprentissage par renforcement à lui seul pourrait générer des gains de performances substantiels.

Cette approche a donné lieu à un phénomène inattendu : le modèle a commencé à allouer du temps de traitement supplémentaire à des problèmes plus complexes, démontrant ainsi sa capacité à hiérarchiser les tâches en fonction de leur difficulté. Les chercheurs de DeepSeek ont ​​décrit ce phénomène comme un « moment d’éveil », au cours duquel le modèle lui-même a identifié et formulé de nouvelles solutions à des problèmes complexes.

Cette étape importante a souligné la puissance de l’apprentissage par renforcement pour débloquer des capacités de raisonnement avancées sans avoir recours à des méthodes d’entraînement traditionnelles comme la SFT.

En substance, les modèles de DeepSeek apprennent en interagissant avec leur environnement et en recevant des commentaires sur leurs actions, de la même manière que les humains apprennent par l’expérience. Cela leur permet de développer des capacités de raisonnement plus sophistiquées et de s’adapter plus efficacement à de nouvelles situations et également de fortement réduire les coûts.

Enfin, DeepSeek utilise des techniques de distillation pour transférer les connaissances et les capacités de modèles plus grands vers des modèles plus petits et plus efficaces. Cela rend l’IA puissante accessible à un plus large éventail d’utilisateurs et d’appareils. C’est comme si un enseignant transférait ses connaissances à un élève, ce qui lui permet d’effectuer des tâches avec une compétence similaire mais avec moins d’expérience ou de ressources.

Le processus de distillation de DeepSeek permet aux modèles plus petits d’hériter des capacités avancées de raisonnement et de traitement du langage de leurs homologues plus grands, ce qui les rend plus polyvalents et accessibles.

Ces techniques innovantes, combinées à l’accent mis par DeepSeek sur l’efficacité et la collaboration open source, ont positionné l’entreprise comme une force disruptive dans le paysage de l’IA.

En raison de ces changements, l’API de DeepSeek, comme l’ont rapporté certains utilisateurs, est 95 % moins chère par jeton que le modèle o1 d’OpenAI tout en ayant des performances similaires. Le modèle DeepSeek est censé être 45 fois plus efficace côté formation que les autres modèles.

Qui plus est, certaines entreprises chinoises d’intelligence artificielle sont en mesure d’exploiter la puissance de calcul des puces avancées de Nvidia via des serveurs cloud basés dans d’autres pays.

Alternativement, ils peuvent simplement acheter plus de semi-conducteurs moins avancés de Nvidia ou les utiliser plus efficacement à l’aide d’un logiciel intelligent. Pour continuer à servir le vaste marché chinois, Nvidia a conçu des processeurs moins puissants, et conformes aux sanctions. Ceux-ci sont entre 10% et 30% plus lents que son kit haut de gamme, et finissent par être plus coûteux pour les clients chinois par unité de puissance de traitement. Mais ils effectuent le travail.

De plus, la Chine pourrait en partie remédier à la pénurie de puces, et de puissance cérébrale, à l’aide de modèles « open source ». Le fonctionnement interne de ces modèles peut être téléchargé par n’importe qui et adapté à une tâche spécifique.

Les laboratoires d’IA chinois pourraient également se prévaloir de modèles open source, qui incarnent la sagesse collective des équipes de recherche internationales. Matt Sheehan du Carnegie Endowment for International Peace, un think thank américain, affirme que la Chine a la forme d’être un « suiveur rapide », ses laboratoires ont absorbé les avancées de l’étranger, puis les ont rapidement incorporées dans leurs propres modèles, souvent avec des ressources d’État abondantes.

Ainsi, il n’y a aucune indication que les restrictions imposées par l’administration Biden sur les puces haut de gamme, ainsi que sur les logiciels et les machines nécessaires à leur fabrication, aient ralenti l’ascension de la Chine dans ce qu’on appelle la quatrième révolution industrielle, c’est-à-dire l’application de l’intelligence artificielle à des secteurs tels que l’industrie manufacturière, l’exploitation minière, l’agriculture et la logistique.

Bien que le contexte de la guerre technologique complique l’évaluation précise des progrès de la Chine, les informations disponibles suggèrent que la Chine fait des avancées à une vitesse inégalée dans ses efforts pour contourner les restrictions technologiques.

Alors, les analystes occidentaux ont surestimé l’impact des contrôles technologiques sur la Chine tout en sous-estimant la capacité de la Chine à les contourner.

Par conséquent, DeepSeek remet en cause l’idée largement répandue selon laquelle l’IA de pointe nécessite une énorme puissance de calcul et plusieurs milliards de dollars. DeepSeek démontre comment l’ingéniosité logicielle peut compenser les contraintes matérielles, et met également en évidence les limites des contrôles à l’exportation américains destinés à ralentir les progrès de la Chine en matière d’intelligence artificielle.

Si ces mesures peuvent entraîner des perturbations à court terme, leur impact diminue au fil du temps, à mesure que la Chine innove pour s’adapter.

Les restrictions américaines sur l’IA ont eu pour effet d’inciter le secteur privé chinois à prendre le relais au secteur public. Et si les États-Unis dominent souvent la recherche de pointe, les entreprises chinoises excellent dans l’exécution, l’accessibilité et la diffusion des produits. Dans le commerce électronique, les véhicules électriques, les panneaux solaires et les batteries, elles ont démontré une capacité impressionnante à évoluer.

Selon les experts du secteur, la concentration de DeepSeek sur la recherche en fait un concurrent dangereux, car l’entreprise préfère partager ses découvertes plutôt que de les protéger pour des gains commerciaux. DeepSeek n’a pas levé de fonds auprès de fonds extérieurs ni pris de mesures significatives pour monétiser ses modèles.

Prenant une voie différente de nombreuses entreprises américaines qui protègent étroitement leurs modèles d’IA, DeepSeek a adopté une stratégie open source, partageant ouvertement son code et ses méthodologies de formation.

Cette approche pourrait accélérer l’innovation et élargir son adoption à l’échelle mondiale, ce qui pourrait réduire l’avantage concurrentiel des entreprises américaines qui dépendent de systèmes propriétaires tels que GPT-4 d’OpenAI ou Bard de Google. Yann LeCun, responsable scientifique en IA chez Meta, a fait remarquer que le succès de DeepSeek souligne le potentiel des modèles open source à surpasser les modèles propriétaires.

Par conséquent, il s’agit là d’un choc majeur pour les fournisseurs de modèles LLM, en particulier les fournisseurs fermés dont l’activité repose (du moins jusqu’à présent) sur la vente d’accès aux modèles LLM les plus performants, tels qu’OpenAI et Anthropic. Le problème est d’autant plus grand que DeepSeek est un modèle open source que tout le monde peut utiliser.

Cela signifie également qu’ils devront aller encore plus vite avec l’innovation et des modèles plus récents, ce qui met la course à l’IA déjà rapide à une autre vitesse car il est clair que la communauté open source va maintenant recevoir un autre coup de pouce en jouant avec le modèle de DeepSeek, de la même manière que Llama open source de Meta a ouvert les vannes de l’open source.

De fait, la communauté open source reste l’espace le plus dynamique, le plus complet, le plus libre et le plus sans frontières en matière de recherche, de partage et de discussion universitaires dans le domaine de l’IA, et l’arène la moins compétitive en interne. L’engagement de DeepSeek en faveur de l’open source dès le premier jour a probablement été soigneusement réfléchi.

Son approche open source est complète, couvrant les pondérations des modèles, les ensembles de données et les méthodes de pré-formation, avec des articles de haute qualité comme partie intégrante. Les jeunes chercheurs brillants gagnent en visibilité grâce à leurs apparitions dans la communauté open source, à leurs partages et à leur engagement. Leur public comprend certains des moteurs les plus influents de l’IA mondiale.

Cette combinaison, jeunes chercheurs intelligents en IA + atmosphère d’institution de recherche (avec de grands packages technologiques) + partage et échange communautaires open source, a élevé l’influence et le prestige de DeepSeek dans le domaine de l’IA à l’échelle mondiale.

Pour une organisation principalement axée sur les résultats de recherche en IA plutôt que sur les produits commerciaux, Hugging Face et Reddit constituent les meilleurs lieux de lancement, les ensembles de données et les référentiels de code constituent les meilleures démonstrations et les articles constituent les meilleurs communiqués de presse.

Dans le même temps, ce modèle open source permet à OpenAI, Anthropic et d’autres d’adopter les innovations qu’ils ont apportées et de les utiliser dans leurs futurs modèles.

En plus de privilégier l’efficacité, les entreprises chinoises adoptent de plus en plus les principes de l’open source. Alibaba Cloud a publié plus de 100 nouveaux modèles d’IA open source, prenant en charge 29 langages et répondant à diverses applications, notamment le codage et les mathématiques. De même, des startups comme Minimax et 01.AI ont ouvert leurs modèles en open source.

« DeepSeek fonctionne comme à ses débuts DeepMind », a déclaré un investisseur en IA à Pékin. « Il est entièrement axé sur la recherche et l’ingénierie. » Liang, qui participe personnellement aux recherches de DeepSeek, utilise les bénéfices de ses opérations sur fonds spéculatifs pour payer les meilleurs salaires aux meilleurs talents en IA. Avec ByteDance, propriétaire de TikTok, DeepSeek est connu pour offrir la rémunération la plus élevée disponible pour les ingénieurs en IA en Chine, avec du personnel basé dans des bureaux à Hangzhou et à Pékin.

Liang a présenté DeepSeek comme une entreprise « locale » unique, composée de titulaires d’un doctorat issus des meilleures écoles chinoises, des universités de Pékin, de Tsinghua et de Beihang plutôt que d’experts issus d’institutions américaines.

Dans une interview accordée à la presse nationale l’année dernière, il a déclaré que son équipe principale « n’était pas composée de personnes revenues de l’étranger. Ils sont tous locaux… Nous devons former les meilleurs talents nous-mêmes ». L’identité de DeepSeek en tant que société de LLM purement chinoise lui a valu des éloges dans son pays.

Ritwik Gupta, chercheur en politique d’IA à l’Université de Californie à Berkeley, a déclaré que la Chine disposait d’un vivier d’ingénieurs systèmes beaucoup plus important que les États-Unis, qui savent comment tirer le meilleur parti des ressources informatiques pour former et exécuter des modèles à moindre coût.

Toutefois, les initiés du secteur affirment que même si DeepSeek a montré des résultats impressionnants avec des ressources limitées, la question de savoir si l’entreprise peut continuer à être compétitive à mesure que le secteur évolue.

D’ailleurs dans une interview accordée au média chinois 36Kr en juillet 2024, Liang a déclaré qu’un autre défi auquel les entreprises chinoises sont confrontées en plus des sanctions sur les puces électroniques est que leurs techniques d’ingénierie de l’IA ont tendance à être moins efficaces. « Nous [la plupart des entreprises chinoises] devons consommer deux fois plus de puissance de calcul pour obtenir les mêmes résultats. Si l’on ajoute à cela les écarts d’efficacité des données, cela pourrait signifier que nous avons besoin de jusqu’à quatre fois plus de puissance de calcul. Notre objectif est de combler en permanence ces écarts », a-t-il déclaré.

Dans tous les cas, DeepSeek prouve que les grands acteurs américains ne sont pas les seuls à pouvoir jouer dans la cour de l’IA générative. D’autres acteurs chinois ont accéléré ces derniers mois comme les start-up 01.AI ou Moonshot AI mais aussi les géants du pays dont Baidu, Alibaba et Tencent.

Alibaba a développé des modèles open source et un robot conversationnel (tous baptisés Qwen) qui sont salués par l’écosystème IA. Il y a quelques semaines, Alibaba Cloud a annoncé une baisse de 85 % du prix d’un de ses modèles, une nouvelle preuve que les entreprises chinoises de la tech ne comptent pas rester sans rien faire face aux Américains. Alibaba pourrait bien faire de nouvelles annonces à l’approche du nouvel an chinois (le 29 janvier), selon plusieurs experts.

En outre, selon un livre blanc publié l’année dernière par l’Académie chinoise des technologies de l’information et de la communication, un institut de recherche affilié à l’État, le nombre de grands modèles linguistiques d’IA dans le monde a atteint 1 328, dont 36 % proviennent de Chine. Cela place la Chine au deuxième rang des plus grands contributeurs à l’IA, derrière les États-Unis.

Il convient de noter qu’au cours de l’année écoulée, les grands modèles open source chinois ont acquis une grande renommée dans la recherche et les produits mondiaux en matière d’IA. On a de plus en plus l’impression que les grands modèles open source chinois sont plus complètement ouverts que certains homologues américains et européens, ce qui les rend plus accessibles aux chercheurs et aux développeurs pour étudier ou optimiser leurs propres modèles.

DeepSeek en est un exemple, tout comme Qwen d’Alibaba, largement considéré comme véritablement open source. Le petit modèle Mini-CPM-Llama3-V2.5 de Mianbi a même gagné une popularité inattendue après avoir été directement adapté par une équipe de premier cycle de Stanford.

Le succès de DeepSeek ne repose pas uniquement sur ses efforts internes. L’entreprise a également noué des partenariats stratégiques pour améliorer ses capacités technologiques et sa portée commerciale. L’une de ses collaborations notables est celle avec AMD , l’un des principaux fournisseurs de solutions de calcul haute performance. DeepSeek s’appuie sur les GPU AMD Instinct et le logiciel ROCM à travers les étapes clés du développement de son modèle, en particulier pour DeepSeek-V3. Ce partenariat permet à DeepSeek d’accéder à du matériel de pointe et à une pile logicielle ouverte, optimisant les performances et l’évolutivité.

Si l’innovation de DeepSeek est révolutionnaire, elle n’a en aucun cas établi une position dominante sur le marché. Comme l’entreprise a publié ses recherches, d’autres entreprises modèles en tireront des leçons et s’adapteront. Meta et Mistral, l’entreprise open source française modèle, sont peut-être un peu en retard, mais il ne leur faudra probablement que quelques mois pour les rattraper.

Comme l’a déclaré Yann Lecun, chercheur principal de Meta : « L’idée est que tout le monde profite des idées des autres. Personne ne « devance » quelqu’un d’autre et aucun pays ne « perd » face à un autre. Personne n’a le monopole des bonnes idées. Tout le monde apprend de tout le monde. » C’est donc l’exécution qui compte.

En fin de compte, ce sont les consommateurs, les startups et les autres utilisateurs qui en sortiront le plus grand profit, car les offres de DeepSeek continueront de faire baisser le prix d’utilisation de ces modèles à un niveau proche de zéro (encore une fois, en dehors du coût d’exécution des modèles au moment de l’inférence).

Cette banalisation rapide pourrait poser des problèmes, voire des souffrances considérables, aux principaux fournisseurs d’IA qui ont investi massivement dans des infrastructures propriétaires. Comme l’ont souligné de nombreux commentateurs, notamment Chamath Palihapitiya, investisseur et ancien dirigeant de Meta, cela pourrait signifier que des années d’OpEx et de CapEx d’OpenAI et d’autres seront gaspillées .

« Cette génération de jeunes chercheurs chinois s’identifie fortement à la culture open source car ils en bénéficient énormément », explique Thomas Qitong Cao, professeur adjoint de politique technologique à l’université Tufts.

« Le contrôle des exportations par les États-Unis a essentiellement acculé les entreprises chinoises dans une situation où elles doivent être beaucoup plus efficaces avec leurs ressources informatiques limitées », explique Matt Sheehan, chercheur en intelligence artificielle au Carnegie Endowment for International Peace. « Nous allons probablement assister à de nombreuses consolidations à l’avenir liées au manque de ressources informatiques. »

Cela a peut-être déjà commencé à se produire. Il y a deux semaines, Alibaba Cloud a annoncé un partenariat avec la start-up pékinoise 01.AI, fondée par Kai-Fu Lee, pour fusionner des équipes de recherche et créer un « laboratoire de modélisation industrielle à grande échelle ».

Enfin, si des modèles d’IA « suffisamment bons » peuvent être entraînés à moindre coût, leur prolifération deviendra inévitable, d’autant plus que de nombreux pays souhaitent désespérément développer leurs propres modèles. De plus, un coût élevé par requête pourrait également inciter à la création de modèles spécialisés, conçus pour offrir des réponses efficaces et précises tout en minimisant le nombre de requêtes nécessaires.

L’autre conséquence de la percée chinoise est que les États-Unis font face à une concurrence asymétrique. Il est désormais évident que la Chine innove pour contourner des obstacles comme le manque des meilleures puces, que ce soit en améliorant l’efficacité ou en compensant l’absence de matériel de haute qualité par une plus grande quantité.

Les puces produites en Chine progressent, y compris celles conçues par Huawei, une entreprise technologique qui, il y a une génération, a réussi à imposer son matériel télécom en adoptant une approche simple et économique.

Si la Chine reste proche de la frontière technologique, elle pourrait être la première à franchir le cap de la superintelligence. Si cela se produit, elle pourrait obtenir bien plus qu’un simple avantage militaire. Dans un scénario de superintelligence, des dynamiques où « le gagnant rafle tout » pourraient brusquement s’imposer.

Même si l’industrie reste sur sa trajectoire actuelle, l’adoption massive de l’IA chinoise à travers le monde pourrait conférer au Parti communiste chinois une influence politique considérable.

Que devrait faire M. Trump ? Son annonce sur les infrastructures était un bon début. Les États-Unis doivent lever les obstacles juridiques à la construction de centres de données. Ils devraient également faciliter l’embauche d’ingénieurs étrangers et réformer les procédures d’achat pour la défense afin de favoriser l’adoption rapide de l’IA.

En tout cas, le triomphe de DeepSeek marque un tournant important, qui annonce une évolution mondiale vers une innovation en matière d’IA rentable et ingénieuse. À mesure que les barrières à l’entrée s’abaissent, le paysage de l’IA devrait voir un afflux de startups modérément financées s’appuyant sur des technologies open source et des techniques novatrices pour perturber le marché. Cette démocratisation pourrait catalyser une nouvelle vague de créativité et de concurrence, redéfinissant les possibilités de développement de l’IA.

Les implications vont au-delà de la Chine et de la Silicon Valley. L’émergence de DeepSeek démontre que l’innovation de classe mondiale ne se limite plus à quelques régions ou entreprises. Elle sert de signal d’alarme pour le secteur, soulignant l’importance de la collaboration, de l’efficacité et de l’adaptabilité pour rester en tête dans un secteur de plus en plus concurrentiel.

Catégories
Bourse Nos analyses

Le Point sur les Marchés: Semaine du 22 au 27 septembre 2024

Pour cette dernière semaine de septembre, les marchés ont montré une certaine volatilité influencée par des facteurs à la fois technologiques et macroéconomiques.

L’une des principales tendances a été l’enthousiasme autour des technologies liées à l’intelligence artificielle. Des entreprises comme Micron ont publié des prévisions solides qui ont ravivé l’intérêt des investisseurs pour les semi-conducteurs et l’IA, stimulant des gains dans des actions comme Nvidia et Broadcom.

Marché français

Une hausse notable cette semaine, avec le CAC 40 progressant de 2% grâce à des annonces positives des entreprises et à un sentiment global plus optimiste. Cependant, certaines valeurs ont subi des pertes importantes, comme Ubisoft, qui a vu son action chuter de 23 % en raison de mauvaises performances dans son secteur des jeux vidéo​.

Marchés obligataires 

Après une courte reprise, les marchés obligataires repartent à la hausse. Les T-Bonds, obligations du Trésor américain à long terme, gagnent 5 points de base à 3,786%, reflétant une hausse des rendements. Les ventes de maisons neuves aux États-Unis ont chuté de 4,7% en août, malgré des prix records.

En Europe, les Bunds allemands atteignent 2,18%, tandis que l’OCDE revoit à la baisse ses prévisions de croissance mondiale. Les investisseurs attendent aussi l’indice PCE, mesure préférée de la Fed pour évaluer l’inflation, vendredi.

Marchés américains 

Les marchés américains sont en hausse, principalement soutenus par les secteurs des matériaux et des biens de consommation discrétionnaires. L’indice Dow Jones a gagné 83,57 points (+0,5%), atteignant 42 208 points, tandis que le Nasdaq a progressé de 100,25 points (+1,06%), passant à 18 180 points.

Le S&P 500 a également progresser à la hausse de 0,6%, porté par les secteurs industriels et des matériaux, malgré un recul des services financiers et de la consommation de base​

Action de la semaine

Depuis le début de cette semaine, l’action Micron Technology (MU) a montré une solide performance, principalement en raison de résultats financiers robustes et d’anticipations positives pour le futur. En l’espace d’une semaine, l’action a gagné environ 25%, passant de 90 $ à 110 $.

Ce mouvement haussier a été alimenté par des résultats du quatrième trimestre meilleurs que prévu et une révision à la hausse des perspectives de revenus pour le trimestre suivant, boostée par la demande croissante en semi-conducteurs liés à l’intelligence artificielle.

Micron a bénéficié d’une forte demande dans le secteur de la mémoire, crucial pour l’infrastructure liée à l’IA, ce qui a poussé d’autres actions technologiques, comme Nvidia, à également grimper​.

Catégories
Entreprises Success story

Cet outil qui utilise l’IA permet de contester les amendes routières pour seulement 1,99€ !

Un nouvel outil novateur émerge dans le paysage bruxellois, promettant de contester les amendes routières en un temps record grâce à l’intelligence artificielle. La plateforme, encore en version bêta mais déjà intrigante, offre une solution rapide et précise pour annuler les amendes de stationnement, les excès de vitesse et les violations de la signalisation.

Mehdi Desmet, Romain Goossens et Marouane Bezdi sont les brillants esprits à l’origine de cette ingénieuse idée, fondée sur trois constats majeurs:

  • Amendes injustifiées: Près de 2.500 amendes de stationnements injustifiées seraient chaque jour à Bruxelles.
  • Manque de connaissance: Un nombre significatif de personnes à Bruxelles ne maîtrisent pas suffisamment les méthodes de contestation ou les lois pour se prémunir efficacement d’une amende routière injustifiée.
  • Oubli ou négligence: Beaucoup de gens ignorent ou ne prennent pas la peine de contester leurs amendes, souvent par manque d’accessibilité aux ressources juridiques.

Mehdi Desmet, un des fondateurs nous présente la plateforme, nommée www.contestation-amende.com, et nous précise qu’elle a pour objectif d’interroger l’utilisateur sous forme d’un formulaire intuitif, adapté au type d’infraction concernée.

Il ajoute que grâce à un entraînement sur des bases légales solides comprenant des articles de loi, de la jurisprudence et l’expertise d’un avocat, l’IA génère des contestations optimisées en quelques minutes. Les utilisateurs peuvent également modifier ensuite certains éléments avant d’envoyer leur contestation à l’administration compétente, de quoi épargner un temps colossal !

Comparé à d’autres outils, les créateurs soulignent que leur IA est spécifiquement formée pour ce contexte juridique spécifique, évitant ainsi les réponses génériques que l’on pourrait soi-même obtenir en utilisant des outils tel que ChatGpt. Des améliorations futures incluent l’affichage d’une probabilité de succès de la contestation, pour garantir que les utilisateurs investissent de manière judicieuse.

Tarif

Actuellement, la tarification prévue est de 2 euros par amende contestée. À l’avenir, l’offre pourrait s’étendre aux clients professionnels avec un modèle d’abonnement. Bien que la plateforme soit actuellement opérationnelle à Bruxelles et en Wallonie, une expansion future est envisagée.

Enfin, les créateurs insistent sur la sécurité des données des utilisateurs, conformément au RGPD, et prévoient une campagne publicitaire de lancement pour recueillir rapidement des retours et améliorer leur produit.

En résumé, cet outil novateur promet une solution rapide et efficace pour contester les amendes routières, offrant aux utilisateurs une opportunité précieuse d’accéder à la justice de manière accessible et efficace.

Catégories
Economie Nos analyses

Qui est Joseph Aloys Schumpeter (1883-1950), l’économiste rebelle appelé parfois « l’hérétique » ?

De nombreux économistes, tels que Smith, Ricardo ou Keynes, ont fait le bonheur de leurs concitoyens grâce à des théories novatrices et largement adoptées par leurs pairs.

Cependant, d’autres ont fait avancer les sciences économiques en nageant à contre-courant des pensées dominantes, quitte à se tenir en marge de l’élite intellectuelle. C’est le cas de l’austro-américain Joseph Aloys Schumpeter, inventeur de la théorie de « destruction créatrice ».

Qui est-il ?

J.A. Schumpeter est né en 1883 dans l’ancien empire austro-hongrois. Il fit des études de droit à l’Université de Vienne où il côtoiera des professeurs qui revisitent les théories d’Adam Smith. C’est là qu’il développera le goût de la réflexion et du changement des idées populaires.

La Première Guerre mondiale suivie de la montée des extrêmes en Allemagne pousseront le jeune universitaire à tenter de nouvelles expériences, peu concluantes, en tant que ministre des Finances puis directeur de banque. Dès le début des années 30, il quitta le Vieux Continent pour enseigner l’économie à Harvard.

Tout au long de sa carrière, il publia plusieurs ouvrages dont les plus célèbres sont « Le cycle des affaires » (1939) et « Capitalisme, socialisme et démocratie » (1942). C’est dans ce dernier que nous retrouvons sa théorie la plus controversée : la destruction créatrice.

Schumpeter meurt en 1950 aux États-Unis (dont il avait pris la nationalité) en laissant inachevé son dernier livre, « Histoire de l’analyse économique », paru en 1954.

La théorie de la destruction créatrice

Dans cette théorie, l’auteur met en avant l’importance des innovations industrielles et les effets destructeurs qu’elles ont sur les concurrents. Schumpeter qualifie lui-même « d’ouragan perpétuel » ce phénomène. Ce sont les entrepreneurs qui, par leur vision novatrice du business, arrivent à obtenir un avantage concurrentiel et à hisser leur entreprise à une situation de quasi-monopole.

Ceci n’est possible que lorsque l’innovation porte sur les produits ou les matières premières utilisées, les méthodes de production, l’organisation au sein de l’entreprise et les marchés à conquérir.

La destruction créatrice explique ainsi l’arrivée de jeunes entreprises qui perturbe l’ordre établi, allant jusqu’à renverser les anciens monopoles.

Schumpeter s’attaqua directement au Capitalisme, lui reprochant de ne pas être viable à long terme dans sa forme actuelle. La libre concurrence devrait laisser place à certains monopoles motivés avant tout par l’innovation.
De plus, cette critique ouverte au capitalisme provenant d’un professeur d’économie fut l’une des raisons pour lesquelles il fut traité « d’hérétique ».

Bien que polémique à sa sortie, la destruction créatrice fait partie aujourd’hui des théories « à la mode » dont s’en inspirent les plus grandes Start-ups. Ainsi, l’arrivée de l’informatique, des GAFAM et de l’intelligence artificielle sont des exemples visibles de ce que voulait nous enseigner Schumpeter.

Il est bon de rappeler que les sciences économiques sont une branche des sciences humaines et sociales. Essayer d’apporter une nouvelle explication théorique du monde qui nous entoure est à l’appréciation de ceux qui vont la vivre. Parfois, l’homme refuse tout simplement la création de la richesse, car il a peur d’affronter la destruction qui la précède.

Par Tim Kazkondu