Faites-vous confiance à AI? Voici pourquoi la moitié des utilisateurs ne le font pas – Computerworld

Le modèle O4-Mini plus petit et plus rapide a fait pire, hallucinant 41% du temps sur PersonQA et 79% sur SimpleQA. Le nouveau modèle GPT-4.5, sorti en février, a mieux fonctionné, avec un taux d’hallucination de 37,1% sur SimpleQA. Openai publie les derniers résultats de ces tests et d’autres Hub d’évaluations de la sécurité.
«L’augmentation des hallucinations par des modèles de raisonnement peut très bien être due à la réflexion sur l’IA», a déclaré Brandon Purcell, vice-président et analyste principal chez Forrester Research.
Les données de recherche de Forrester s’alignent sur d’autres examen contre la confiance de l’IA: plus de la moitié des chefs d’entreprise s’inquiètent de l’IA générative, ralentissant l’adoption et limitant sa valeur, selon le cabinet de recherche. Pour combler cet écart de confiance, les entreprises devraient exiger la transparence, investir dans une IA explicable et traçable et surveiller les performances en temps réel, a déclaré Purcell.