(D) combiner des invites en boîte et point avec SAM 2.1 pour une segmentation plus cohérente – les meilleures pratiques?

Je développe une application en utilisant SAM 2.1 (via FastAPI) pour la segmentation des objets en temps réel à partir d’un flux de caméra en direct. Le frontend envoie une boîte ou une invite de point au backend, qui renvoie un masque composé dans une toile pour la manipulation et l’exportation. Chaque type d’invite fonctionne bien isolément – mais ils sont incohérents dans différentes classes d’objets. Quelques exemples:
J’explore maintenant en combinant les deux types d’invites: dessiner une boîte de délimitation et permettant à l’utilisateur de taper à l’intérieur pour renforcer l’intention. Puisque SAM 2.1 accepte les deux
J’apprécierais les informations de toute personne déploiement des variantes SAM ou expérimentant les UIS de segmentation. Essayer d’optimiser pour une large classe d ‘«objets physiques irréguliers» où les limites sémantiques ne sont pas toujours visuellement dominantes. soumis par / u / w0nx |