(D) Pourquoi l’extraction de table n’est-elle pas encore résolue par les modèles multimodaux modernes?

Intelligence Artificielle
Noesis News
mars 30, 2025
0
48
2 minutes de lecture

Il y a beaucoup de battage médiatique autour de modèles multimodaux, tels que Qwen 2.5 VL ou Omni, GOT, Smoldocling, etc. Je voudrais savoir si d’autres ont fait une expérience similaire dans la pratique: bien qu’ils puissent faire des choses impressionnantes, ils ont toujours du mal avec l’extraction de la table, dans les cas qui sont simples pour les humains.

Attaché est un exemple simple, tout ce dont j’ai besoin est une reconstruction de la table en tant que CSV plat, préservant correctement toutes les cellules vides vides. Quel modèle open source est capable de le faire?

https://preview.redd.it/krox7ytlhvre1.png?width=1650&format=png&auto=webp&s=5daa7f68f4acc55f4bdac3b2defa21b9ebfae0d9

soumis par / u / electronic-leter592
(lien) (Commentaires)

Source link

(D) Pourquoi l’extraction de table n’est-elle pas encore résolue par les modèles multimodaux modernes?

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Pourquoi Jamie a-t-il tué Katie à l’adolescence? Qu’est-ce...

Bitcoin prêt à récupérer 90 000 $, selon...

Les innovations SS atteignent 4 000 chirurgies robotiques...

Apprenez vos animaux de ferme avec l’IA!

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags