Google vient de lancer Gemini, son dernier-né en matière de modèles de langage basés sur l’intelligence artificielle, qui vise à détrôner le célèbre GPT-4. Présenté pour la première fois lors de la conférence des développeurs I/O en juin, Gemini est désormais accessible au public et devrait avoir un impact majeur sur tous les produits du géant du web.
Sundar Pichai, PDG de Google, et Demis Hassabis, PDG de Google DeepMind, voient en Gemini une véritable avancée technologique dont les applications sont multiples :
- Bard, disponible dès à présent
- Gemini Pro qui alimentera bientôt de nombreux services d’IA de Google
- Gemini Ultra, conçu principalement pour les centres de données et les applications d’entreprises
En outre, Gemini sera également intégré dans les Pixel 8 Pro grâce à Gemini Nano, dans les produits publicitaires de Google, et éventuellement dans le navigateur Chrome.
Sommaire
Les prouesses de Gemini face à GPT-4
Google a mené 32 tests comparatifs opposant Gemini et GPT-4, incluant des benchmarks généraux tels que la compréhension du langage multitâche ainsi qu’une évaluation de la capacité à générer du code Python. D’après les résultats, Gemini l’emporte dans 30 des 32 tests effectués.
Le principal avantage de Gemini réside dans sa capacité à traiter et interagir avec le son et l’image. Contrairement à OpenAI qui a développé des modèles distincts pour l’audio et la vidéo, Google a misé sur un modèle multisensoriel dès le départ. Cela lui permettra d’acquérir encore plus de sensibilité et de précision au fil du temps, notamment en ce qui concerne l’action et le toucher.
Cependant, il convient de noter que ces comparaisons ne constituent pas une évaluation définitive des capacités de Gemini, qui seront véritablement mises à l’épreuve par les utilisateurs quotidiens souhaitant exploiter son potentiel pour générer des idées, rechercher des informations, ou encore coder.
Le fort potentiel de Gemini dans le domaine de la programmation
Google semble particulièrement miser sur l’utilisation de Gemini pour la génération de code, grâce à un nouveau système appelé AlphaCode 2. Ce dernier affiche des performances supérieures à 85% des participants lors des compétitions de codage, contre seulement 50% pour la version précédente, AlphaCode.
Gemini, point de départ d’un projet global
L’objectif de Google va bien au-delà du simple lancement de Gemini. Les dirigeants ainsi que les chercheurs chez Google voient en ce produit le début d’un vaste projet qui pourrait amener à la réalisation du rêve ultime en matière d’intelligence artificielle : l’intelligence générale artificielle (AGI).
Cette technologie autonome et auto-améliorée pourrait dépasser les capacités humaines, offrant des perspectives révolutionnaires en termes de progrès scientifique et social.
La prudence de Google dans le développement de Gemini
Toutefois, les dirigeants et chercheurs chez Google sont conscients des défis que cette course à l’IA peut engendrer. En effet, la sécurité et la responsabilité doivent être au cœur des préoccupations lors du développement d’une telle technologie.
Pour atteindre cet objectif, des tests internes et externes ont été menés afin d’identifier d’éventuelles failles ou dérives liées à l’utilisation de l’intelligence artificielle. Hassabis souligne également l’importance de déployer une version bêta contrôlée pour Gemini Ultra, afin d’établir une « zone d’expérimentation plus sûre » pour ce modèle très avancé.
Pour conclure
Le lancement de Gemini représente un moment clé pour Google et pour l’ensemble du secteur de l’intelligence artificielle. Alors que les limites entre innovation et responsabilité devront être constamment évaluées, il ne fait aucun doute que Gemini marque le début d’une nouvelle ère pour Google et ses utilisateurs. L’impact potentiel de cette technologie est immense et promet d’amener les performances de l’IA à un tout autre niveau.
Je ne crois pas u,ne seconde qu’il va détrôner le célèbre GPT-4 d’Open AI !