(D) Recherche d’idées: comment construire un OCR très précis pour les codes alphanumériques courts?

Je travaille sur une tâche qui implique la lecture des codes alphanumériques à 9 caractères à partir d’extraits de petits papier – similaires aux codes de bon ou aux séries imprimées (exemple d’images ci-dessous) – il y a deux cas – une formation pour détecter uniquement les codes solides et les deux solides et en pointillés. Le plus grand défi est précision – Nous avons besoin de résultats presque parfaits. Les modèles confondent souvent I vs 1 ou O vs 0et même un seul caractère mal lu rend l’ensemble du code invalide. Par exemple, Amazon textract atteint une précision de 93% dans nos tests – décent, mais toujours pas assez fiable. Ce que j’ai essayé jusqu’à présent:
Meilleurs résultats (jusqu’à présent): Yolo formé sur mesureApproche:
Cette configuration fonctionne mieux que prévu. Il est rapide, adaptable à différentes polices et distorsions, et plus fiable que les autres modèles que j’ai testés. Cela dit, les cas Edge restent – en particulier les classifications erronées de caractères visuellement similaires. À ce stade, je me penche vers une solution plus spécialisée – quelque chose entre l’OCR classique et la détection d’objets, optimisé pour Texte structuré court comme des codes ou des étiquettes de prix. Je suis curieux:
Actuellement, j’ai environ 300 exemples – pas assez, semble-t-il. Qu’est-ce qu’une bonne cible? Merci d’avance! Au plaisir d’apprendre de vos expériences. soumis par / U / EHPPHDOCTOR007 |