Flash 1.5, Gemma 2 et Project Astra

Robotique
Noesis News
mars 10, 2025
0
43
4 minutes de lecture

1.5 Flash excelle à la résumé, les applications de chat, le sous-titrage de l’image et la vidéo, l’extraction de données à partir de documents et de tables longs, et plus encore. En effet, il a été formé par 1,5 Pro grâce à un processus appelé «distillation», où les connaissances et les compétences les plus essentielles d’un modèle plus large sont transférées à un modèle plus petit et plus efficace.

En savoir plus sur 1.5 Flash dans notre mise à jour Gémeaux 1.5 Rapport techniquesur le Page de technologie Geminiet découvrez 1.5 Disponibilité et tarification de Flash.

Améliorer considérablement 1,5 pro

Au cours des derniers mois, nous avons considérablement amélioré 1,5 Pro, notre meilleur modèle de performance générale sur un large éventail de tâches.

Au-delà de l’extension de sa fenêtre de contexte à 2 millions de jetons, nous avons amélioré sa génération de code, son raisonnement logique et sa planification, sa conversation multi-tours et sa compréhension de l’audio et de l’image à travers les données et les avancées algorithmiques. Nous constatons de fortes améliorations sur les références publiques et internes pour chacune de ces tâches.

1.5 Pro peut désormais suivre des instructions de plus en plus complexes et nuancées, y compris celles qui spécifient le comportement au niveau du produit impliquant le rôle, le format et le style. Nous avons amélioré le contrôle des réponses du modèle pour des cas d’utilisation spécifiques, comme la création de la personnalité et le style de réponse d’un agent de chat ou l’automatisation des workflows via plusieurs appels de fonction. Et nous avons permis aux utilisateurs de diriger le comportement du modèle en définissant instructions système.

Nous avons ajouté une compréhension audio dans le API Gemini et Google AI Studiodonc 1.5 Pro peut désormais raisonner à travers l’image et l’audio pour les vidéos téléchargées dans Google AI Studio. Et nous intégrons maintenant 1.5 Pro dans Google Products, y compris Gemini avancé et dans Espace de travail applications.

En savoir plus sur 1.5 Pro dans notre mise à jour Gémeaux 1.5 Rapport technique Et sur le Page de technologie Gemini.

Gemini Nano comprend les entrées multimodales

Gemini Nano se développe au-delà des entrées en texte uniquement pour inclure également des images. En commençant par Pixel, les applications utilisant des Gemini Nano avec la multimodalité pourront comprendre le monde comme les gens – non seulement par le texte, mais aussi par la vue, le son et la langue parlée.

En savoir plus sur Gemini 1.0 Nano sur Android.

Source link

Flash 1.5, Gemma 2 et Project Astra

Améliorer considérablement 1,5 pro

Gemini Nano comprend les entrées multimodales

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Arrêter d’écrire un python désordonné: un cours accidentel...

The best sunglasses for seniors in 2025, according...

40 mèmes hilarants relatables partagés sur le compte...

WELEVEL RAshes 5,7 millions de dollars au développement...

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Améliorer considérablement 1,5 pro

Gemini Nano comprend les entrées multimodales

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags