Comment l’apprentissage en profondeur a révolutionné l’OCR avec Cha Zhang
Aujourd’hui, nous sommes rejoints par Cha Zhang, un directeur d’ingénierie partenaire chez Microsoft Cloud & AI.
Le travail de CHA chez MSFT est axé sur l’exploration des moyens pour lesquels de nouvelles technologies peuvent être appliquées à la reconnaissance optique des caractères, ou OCR, repoussant les limites de ce qui a été considéré comme un problème par ailleurs «résolu». Dans notre conversation avec le CHA, nous explorons certains des défis traditionnels de l’OCR à l’état sauvage, et quelles sont les façons dont les algorithmes d’apprentissage en profondeur sont appliqués pour transformer ces solutions.
Nous discutons également des difficultés d’utilisation d’un pipeline de bout en bout pour le travail OCR, s’il existe un cadrage semi-supervisé qui pourrait être utilisé pour l’OCR, le rôle de techniques comme la recherche d’architecture neuronale, comment les progrès de la PNL pourraient influencer les progrès des problèmes de l’OCR, et bien plus encore.
