(D) Comment extraire le tableau du PDF comme celui-ci?

Intelligence Artificielle
Noesis News
avril 14, 2025
0
113
3 minutes de lecture

J’ai essayé avec PDFPLUMBER et PYPDF2, et les API LLM telles qu’Openai et Claude, mais aucun d’eux ne fonctionne.

PDFPLUMBER et PYPDF2 peuvent généralement recoganiser le contenu de la table, mais manquer beaucoup de chiffres, et la structure du tableau est gâchée.

Les API LLM peuvent bien générer la structure du tableau, mais ont beaucoup de mauvais nombres. Par exemple, est recoganisé comme 8 ou 9 …

J’essaie d’extraire toutes les données et d’essayer un modèle ARIMA pour la pratique, mais coincé à la toute première étape – obtenir les données …

Des suggetions?

https://preview.redd.it/tr8ifgrd5Tue1.png?width=2032&format=png&auto=webp&s=0ac820ab2250f5d0fd0dced9149a52b5bde59f99

Les données proviennent du Toronto Regional Real Estate Board. Ils n’offrent pas de données brutes, semblent. Au moins, je ne le trouve pas.

soumis par / u / ericytt
(lien) (Commentaires)

Source link

(D) Comment extraire le tableau du PDF comme celui-ci?

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Pourquoi Jamie a-t-il tué Katie à l’adolescence? Qu’est-ce...

Bitcoin prêt à récupérer 90 000 $, selon...

Les innovations SS atteignent 4 000 chirurgies robotiques...

Apprenez vos animaux de ferme avec l’IA!

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags