(P) Docstrange – Extracteur de données de document open source avec traitement cloud gratuit pour 10k DOC / mois

 (P) Docstrange – Extracteur de données de document open source avec traitement cloud gratuit pour 10k DOC / mois


Partage Docstrangeune bibliothèque Python open source qui facilite l’extraction de données de documents.

  • Entrée universelle: PDFS, images, documents de mots, PowerPoint, Excel
  • Multiples sorties: Clean Markdown, JSON structuré, tables CSV, HTML formaté
  • Extraction intelligente: Spécifiez les champs exacts que vous souhaitez (par exemple, "invoice_number", "montant total")
  • Support de schéma: Définir les schémas JSON pour une sortie structurée cohérente

Démarrage rapide:

pip install docstrange docstrange invoice.jpeg --output json --extract-fields invoice_amount buyer seller 

Options de traitement des données:

  • Mode nuageux: Traitement rapide et gratuit avec une configuration minimale, 10K Docs gratuits par mois
  • Mode local: Intimité complète – tout le traitement se produit sur votre machine, aucune donnée envoyée nulle part, fonctionne sur CPU et GPU

Github: https://github.com/nanonets/docstrange

soumis par / u / Lostambassador6872
(lien) (Commentaires)



Source link

Related post