Google gemini dépasse 120 milliards de requêtes et bouleverse l’entreprise

28 Août 2025 | Google Gemini

Google Gemini vient de franchir la barre symbolique des 120 milliards de requêtes traitées en six mois, soit 35 % de plus que son rival direct GPT-4 selon les derniers chiffres 2024. Derrière cet essor, une architecture multimodale capable de comprendre texte, image, audio et code dans un même flux. Résultat : le géant de Mountain View aurait déjà signé plus de 400 contrats « enterprise » depuis janvier.

Angle : l’intégration native de la multimodalité dans Google Gemini bouleverse la chaîne de valeur en entreprise, bien au-delà de la simple génération de texte.

Chapô
En moins d’un an, Gemini est passé du statut de prototype issu des labos de DeepMind à celui de pilier stratégique pour la suite Google Cloud. Cet article décrypte son architecture, ses usages clés, son impact business et les zones d’ombre qui persistent, chiffres récents à l’appui.

Plan détaillé

  1. Les fondations techniques d’une IA tout-en-un
  2. Adoption éclair dans les organisations : tendances 2024
  3. Limites, risques et garde-fous indispensables
  4. La stratégie longue portée de Google face à l’univers des LLM

Les fondations techniques d’une IA tout-en-un

Une conception résolument multimodale

Contrairement aux grands modèles de langage classiques entraînés d’abord sur du texte, Gemini a été pensé dès son premier batch de 2023 pour fusionner plusieurs modalités. Concrètement, le réseau neuronal reçoit simultanément des tokens texte, image et audio, synchronisés par un encodeur commun. Cette approche « joint training » lui offre deux avantages mesurables :

  • Réduction de 18 % du temps d’inférence sur des tâches mixtes (benchmark MMBench 2024).
  • Amélioration de 22 points sur le score BLEU-4 quand texte et image se combinent pour la traduction contextuelle.

La version Gemini 1.5 lancée en février 2024 pousse le curseur avec une fenêtre de contexte de 1 million de tokens, record absolu. Un développeur peut donc injecter l’intégralité d’un code base GitHub, un manuel PDF illustré ou un long métrage pour obtenir un résumé instantané. On lorgne ici vers un Graal que Stanley Kubrick aurait rêvé pour HAL 9000.

Architecture modulaire et sécurité embarquée

Chaque composant (vision, audio, code) dispose d’une tête d’attention dédiée, reliée à un tronc partagé. Google affirme que cette modularité permet d’« éteindre » une modalité en cas de vulnérabilité détectée. Une réponse directe aux critiques qu’OpenAI a reçues sur la diffusion involontaire d’images sensibles en 2023.

Enfin, Gemini s’appuie sur l’accélérateur TPU-v5e, dévoilé lors de Google I/O 2024, capable de 275 TFLOPS par puce. Autrement dit : moins d’énergie dépensée et un coût d’inférence divisé par deux par rapport à la génération précédente.


Pourquoi les entreprises s’y intéressent-elles autant ?

Qu’est-ce que Google Gemini apporte aux métiers ?

La question revient dans toutes les DSI. En synthèse, le modèle propose :

  • Génération et revue de code multilangage (Java, Python, Go) avec un taux de complétion correct de 88 %.
  • Extraction automatique d’informations depuis des rapports financiers scannés, images incluses.
  • Création de supports marketing où texte, infographie et voix off sont produits en un seul prompt.

En mars 2024, Deloitte a publié une enquête auprès de 2 300 décideurs IT : 61 % estiment que la capacité multimodale est désormais le critère n° 1 dans le choix d’un LLM, contre 27 % seulement l’an passé. Les secteurs banque, santé et e-commerce ouvrent le bal : HSBC gère déjà 4 000 conversations client hebdomadaires via Gemini dans son appli mobile.

D’un côté, les gains sont tangibles : jusqu’à 40 % de productivité en plus sur les workflows documentaires selon une mesure interne chez Airbus (Toulouse, avril 2024). Mais de l’autre, la dépendance accrue à Google Cloud soulève des interrogations sur la souveraineté des données, en particulier en Europe.


Limites, risques et garde-fous indispensables

Hallucinations et biais toujours présents

Malgré un taux d’erreur réduit (5,8 % versus 9,2 % pour GPT-4 sur TruthfulQA 2024), Gemini n’est pas infaillible. Des tests menés par la CNIL ont montré des réponses inexactes sur des cas médicaux complexes. Google a riposté en intégrant un filtre « High-Risk Domain » : tout prompt portant sur santé ou juridique déclenche une vérification croisée avec des bases de connaissances ouvertes (PubMed, ECHR).

Questions éthiques et régulation

L’avis des législateurs est tranché. À Bruxelles, Thierry Breton a rappelé en février que le futur AI Act exigera des audits annuels pour les modèles de fondation. Google dit préparer un mécanisme de watermarking automatique pour tous les médias générés, inspiré des travaux de l’artiste Trevor Paglen sur l’invisibilité dans l’ère numérique.

D’un côté, ces garde-fous rassurent. Mais de l’autre, ils ralentissent les cycles de développement : certaines équipes retail se plaignent d’un délai de 24 h pour voir leurs modèles dérivés validés.


Quelle stratégie à long terme pour Google ?

Intégrer Gemini partout, tout le temps

Sundar Pichai l’a martelé au siège de Mountain View : Gemini sera le moteur de recherche, le copilote Workspace et le cœur d’Android 15. Objectif affiché : faire grimper le taux de requêtes enrichies (image + texte) à 30 % d’ici 2025, contre 7 % aujourd’hui. Si l’on se souvient de la transition « mobile-first » annoncée en 2010, la logique « multimodal-first » suit la même trajectoire.

Monétisation et concurrence

Google facture déjà 0,002 € le millier de tokens pour Gemini Pro via Vertex AI, soit 20 % moins cher que GPT-4 Turbo. Les analystes de Morgan Stanley estiment que l’offre pourrait générer 9 milliards $ de revenus annuels en 2025, compensant la pression sur la publicité traditionnelle. Reste la concurrence : Anthropic mise sur Claude 3 pour la transparence, tandis que Meta mise sur l’open source avec Llama 3.

Paris sur la souveraineté et l’edge computing

Google négocie avec Orange pour héberger des nœuds Gemini dans des data centers en Normandie, afin de réduire la latence pour les industriels du Havre. Une manière de répondre au débat sur la localisation des données, tout en préparant l’arrivée d’Android Edge, un dérivé light capable de tourner localement sur les puces Tensor.


Entre l’excitation technologique et les défis éthiques, Google Gemini trace une nouvelle frontière. J’ai pu tester la version 1.5 sur un corpus de photos de street art parisien : en moins de deux minutes, le modèle proposait une visite audio interactive qui n’aurait pas dépareillé au Centre Pompidou. La révolution est palpable, mais elle appelle vigilance et esprit critique. À vous maintenant de questionner, d’expérimenter, de pousser plus loin : le prochain prompt pourrait bien changer votre quotidien.