(P) ensemble de données petit et déséquilibré – que faire
|
Bonjour à tous! Je suis actuellement dans la 1ère année de mon doctorat, et mon PI m’a demandé d’appliquer des algorithmes ML à un ensemble de données (n = 106, w / n = 21 dans la classe positive). Comme vous pouvez le voir, les mesures de performance sont assez pauvres, et je ne sais pas comment procéder … J’ai recherché à la fois dans ce SUBREDDIT et Internet, et j’ai essayé d’utiliser LOOCV et Stratified K-Fold comme méthodes de validation croisée. Cependant, les résultats sont constamment décevants avec les deux approches. Cela pourrait-il être dû à une fuite de données? Ou est-il simplement inapproprié d’appliquer ML à ce type de jeu de données? Informations supplémentaires: soumis par / U / Practical-Pin8396 |
