Flash 1.5, Gemma 2 et Project Astra

 Flash 1.5, Gemma 2 et Project Astra


1.5 Flash excelle à la résumé, les applications de chat, le sous-titrage de l’image et la vidéo, l’extraction de données à partir de documents et de tables longs, et plus encore. En effet, il a été formé par 1,5 Pro grâce à un processus appelé «distillation», où les connaissances et les compétences les plus essentielles d’un modèle plus large sont transférées à un modèle plus petit et plus efficace.

En savoir plus sur 1.5 Flash dans notre mise à jour Gémeaux 1.5 Rapport techniquesur le Page de technologie Geminiet découvrez 1.5 Disponibilité et tarification de Flash.

Améliorer considérablement 1,5 pro

Au cours des derniers mois, nous avons considérablement amélioré 1,5 Pro, notre meilleur modèle de performance générale sur un large éventail de tâches.

Au-delà de l’extension de sa fenêtre de contexte à 2 millions de jetons, nous avons amélioré sa génération de code, son raisonnement logique et sa planification, sa conversation multi-tours et sa compréhension de l’audio et de l’image à travers les données et les avancées algorithmiques. Nous constatons de fortes améliorations sur les références publiques et internes pour chacune de ces tâches.

1.5 Pro peut désormais suivre des instructions de plus en plus complexes et nuancées, y compris celles qui spécifient le comportement au niveau du produit impliquant le rôle, le format et le style. Nous avons amélioré le contrôle des réponses du modèle pour des cas d’utilisation spécifiques, comme la création de la personnalité et le style de réponse d’un agent de chat ou l’automatisation des workflows via plusieurs appels de fonction. Et nous avons permis aux utilisateurs de diriger le comportement du modèle en définissant instructions système.

Nous avons ajouté une compréhension audio dans le API Gemini et Google AI Studiodonc 1.5 Pro peut désormais raisonner à travers l’image et l’audio pour les vidéos téléchargées dans Google AI Studio. Et nous intégrons maintenant 1.5 Pro dans Google Products, y compris Gemini avancé et dans Espace de travail applications.

En savoir plus sur 1.5 Pro dans notre mise à jour Gémeaux 1.5 Rapport technique Et sur le Page de technologie Gemini.

Gemini Nano comprend les entrées multimodales

Gemini Nano se développe au-delà des entrées en texte uniquement pour inclure également des images. En commençant par Pixel, les applications utilisant des Gemini Nano avec la multimodalité pourront comprendre le monde comme les gens – non seulement par le texte, mais aussi par la vue, le son et la langue parlée.

En savoir plus sur Gemini 1.0 Nano sur Android.



Source link

Related post