Échelle d’infrastructure et systèmes d’IA composés avec Jared Quincy Davis

 Échelle d’infrastructure et systèmes d’IA composés avec Jared Quincy Davis


Dans cet épisode, Jared Quincy Davis, fondateur et PDG de Foundry, présente le concept de «systèmes d’IA composés», qui permet aux utilisateurs de créer des applications puissantes et efficaces en composant plusieurs modèles et services d’IA, souvent divers, souvent divers. Nous discutons de la façon dont ces «réseaux de réseaux» peuvent pousser la frontière de Pareto, fournissant des résultats qui sont simultanément plus rapides, plus précis et encore moins chers que les approches à modèle unique. En utilisant des exemples comme le «décodage laconique», Jared explique les techniques pratiques pour construire ces systèmes et les principes sous-jacents de l’échelle du temps d’inférence. La conversation se plonge également dans le rôle critique de la co-conception, où l’évolution des algorithmes d’IA et l’infrastructure nuageuse sous-jacente sont profondément liées, façonnant l’avenir de l’IA agentique et du paysage de calcul.



Source link

Related post