Vous avez de l’argent de rechange? Vous en aurez besoin pour la nouvelle API d’Openai

 Vous avez de l’argent de rechange? Vous en aurez besoin pour la nouvelle API d’Openai


Le chercheur d’Openai, Hyung, a remporté Chung. Image: Openai / YouTube

Les modèles de raisonnement, qui consacrent du temps à la réflexion approfondie à travers les invites, sont à l’avant du pack d’interface utilisateur génératif. Openai a annoncé le 20 mars O1-Pro, une version lourde de l’un de ses modèles de raisonnement.

Les développeurs sur l’un des niveaux payants d’Openai peuvent trouver O1-Pro dans l’API OpenAI à partir d’aujourd’hui. Ceux qui ont des niveaux d’utilisation plus élevés auront des limites de file d’attente de demande et de lots plus élevées.

Le prix reflète une plus grande puissance de calcul: O1-Pro coûte 150 $ pour 1 million de jetons d’entrée et 600 $ pour 1 million de jetons de production. Comparez cela à 15,00 $ pour 1 million de jetons et 60 $ pour 1 million de jetons de sortie lors de l’utilisation du modèle de base d’Openai O1.

Voir: Récapitulatif OpenAI: le modèle O3 enveloppe 12 jours d’annonces

Quelles capacités 600 $ par million de jetons déverrouillent-ils?

Le prix fait Openai o1-pro L’un des modèles d’IA les plus chers. Il prend la couronne de l’accès à l’API au GPT-4.5 de la Silicon Valley Darling. (GPT-4,5 coûte 75 $ par million de jetons d’entrée et 150 $ par million de jetons de production.)

Qu’obtenez-vous pour cet argent? Openai espère probablement que O1-Pro a fait appel à une poignée de chercheurs, d’ingénieurs et d’autres professionnels en utilisant AI génératif pour la science, la médecine ou la technologie. Alors que O1-Pro est optimisé pour le raisonnement des tâches, OpenAI propose des modèles distincts de transcription ou de modération. Un modèle plus petit et moins cher peut probablement répondre aux besoins des utilisateurs pour ceux-ci.

Pour le prix de l’O1-Pro, vous obtenez une fenêtre de contexte de 200 000 et 100 000 jetons de sortie max.

Openai a déclaré que O1-Pro peut interpréter les données de vision à la machineavec un texte et une entrée d’image. Cependant, il ne produit que la sortie de texte. Dans l’API, il supporte également:

  • Fonction appelle.
  • Sorties structurées, qui garantissent que la réponse du modèle sera conforme au schéma JSON du développeur.
  • L’intégration avec l’API des réponses, qui peut être utilisée pour créer des agents d’IA qui peuvent interagir avec le Web de diverses manières, y compris l’exécution de recherches.
  • L’intégration avec l’API par lots, qui permet des demandes asynchrones, offrant des coûts plus bas et des limites de taux plus élevées pour les emplois avec un délai d’exécution de 24 heures.

OpenAI n’a pas spécifié publiquement la date d’exécution exacte des connaissances pour O1-Pro, mais les modèles précédents avaient une connaissance du monde réel jusqu’à la fin 2023.

Les sociétés d’IA sont en concurrence pour dominer le paysage du «modèle de raisonnement»

Openai présenté O1 comme «fraise» en septembre 2024. Il rivalise avec R1 de DeepseekAnthropic’s Claude Sonnet 3.7, Grok 3, Google’s Gemini 2.0 et d’autres modèles de raisonnement. Meta travaille sur le «raisonnement de la théorie de l’esprit», mais c’est une question légèrement différente: Meta dit qu’il s’agit d’un projet contradictoire pour évaluer les modèles d’IA avancés.



Source link

Related post