(D) Les modèles Frontier AI échouent toujours aux tâches physiques de base: une étude de cas de fabrication

Intelligence Artificielle
Noesis News
avril 16, 2025
0
83
3 minutes de lecture

Les LLM ont fait des progrès significatifs sur de nombreuses tâches de col blanc. Comment fonctionnent-ils sur des tâches de col bleu simples? Ce message a une étude de cas détaillée sur la fabrication d’une pièce simple en laiton.

Tous les modèles frontaliers font terriblement, même sur les parties les plus faciles de la tâche. Étonnamment, la plupart des modèles ont également de terribles capacités visuelles et ne sont pas en mesure d’identifier des fonctionnalités simples de la pièce. Gemini-2.5-Pro fait de son mieux, mais est toujours très mauvais.

En conséquence, nous devons nous attendre à voir des progrès dans le monde physique qui sont considérablement retardés dans le monde numérique, à moins que de nouvelles architectures ou des objectifs de formation n’améliorent considérablement la compréhension spatiale et l’efficacité de l’échantillon.

Lien vers le message ici: https://adamkarvonen.github.io/machine_learning/2025/04/13/llm-manufacturing-eval.html

https://preview.redd.it/4oyx33r6g8ve1.jpg?width=2371&format=pjpg&auto=webp&s=0130482db71ca5b443acca30295643e270ddf770

soumis par / u / Seraine
(lien) (Commentaires)

Source link

(D) Les modèles Frontier AI échouent toujours aux tâches physiques de base: une étude de cas de fabrication

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Arrêter d’écrire un python désordonné: un cours accidentel...

The best sunglasses for seniors in 2025, according...

40 mèmes hilarants relatables partagés sur le compte...

WELEVEL RAshes 5,7 millions de dollars au développement...

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags