Google Corp. fait face à une augmentation sans précédent de la pression sur son infrastructure d'intelligence artificielle. Selon la direction, l'entreprise est contrainte de doubler sa puissance de calcul tous les six mois.
Cette annonce a été faite par le vice-président de Google Cloud, Amin Vahdat, lors d'une réunion générale des employés. Il a souligné que l'entreprise doit se développer "encore 1 000 fois dans les 4 à 5 prochaines années", a rapporté CNBC.
Selon Vahdat, le problème ne repose pas seulement sur la nécessité d'augmenter les performances, mais aussi sur le maintien des mêmes coûts et niveaux de consommation d'énergie. Il a noté que Google est obligé de construire une infrastructure "plus fiable, performante et évolutive" que les solutions disponibles aujourd'hui.
En même temps, a-t-il déclaré, la société doit éviter une hausse du coût d'exploitation des centres de données.
La croissance de la demande en IA reste un facteur limitant clé, a noté le dirigeant. Dans ce cas, les analystes ne savent toujours pas dans quelle mesure elle est formée par l'activité réelle des utilisateurs, et dans quelle mesure par l'intégration des fonctions d'IA dans les services Google.
OpenAI, qui construit six centres de données aux États-Unis pour son projet Stargate de plus de 400 milliards de dollars, est confronté à des défis d'infrastructure similaires.
Un obstacle supplémentaire reste la pénurie mondiale de GPU Nvidia nécessaires pour entraîner et produire des modèles d'IA. Dans un récent rapport trimestriel, l'entreprise a déclaré que ses puces étaient "épuisées", et la pénurie affecte déjà le calendrier d'adoption technologique de Google.
Le PDG de Google, Sundar Pichai, a cité l'exemple de l'outil Veo, qui n'a pas pu être étendu à plus d'utilisateurs en raison des limites de capacité.
Pour réduire sa dépendance à Nvidia, Google mise sur ses propres conceptions de silicium. En novembre, l'entreprise a dévoilé ses processeurs TPU de septième génération, qui seraient près de 30 fois plus économes en énergie que la première version.
En outre, Google prévoit d'optimiser les architectures de modèles et d'étendre son infrastructure physique de centres de données.
Pichai a averti les employés que 2026 sera une "année chargée" en raison de la concurrence et de la nécessité de répondre à la demande de services cloud. Il a admis que les discussions sur la surchauffe du marché de l'IA sont "certainement pertinentes", mais l'entreprise est prête à continuer d'accélérer le développement de son infrastructure.


