Je suis heureux de présenter treemindune bibliothèque Python haute performance pour interpréter des modèles basés sur des arbres.
Que vous ayez audité des modèles, en déboguez le comportement des fonctionnalités ou en explorant les interactions des fonctionnalités, treemind Fournit une solution robuste et évolutive avec des explications visuelles significatives.
- Analyse des fonctionnalités Comprendre comment les caractéristiques individuelles influencent les prédictions du modèle à travers différents intervalles de division.
- Détection d’interaction Détecter et classer automatiquement les interactions de fonctions d’ordre par paire ou d’ordre supérieur.
- Support du modèle Fonctionne de manière transparente avec LightGBM, XGBOost, Catboost, Scikit-Learn et Perpetual.
- Performances optimisées Rapide même sur des ensembles profonds et larges via des internes à dos de cython.
- Visualisations Comprend un module de tracé pour les cartes d’interaction, l’importance des cartes thermiques, les graphiques d’influence des caractéristiques, etc.
Installation
pip install treemind
Explication de caractéristiques unidimensionnelles
Chaque ligne du tableau montre comment le modèle se comporte dans une plage spécifique de la fonction sélectionnée.
Le value La colonne représente la prédiction moyenne dans cet intervalle, ce qui facilite l’identification des plages de valeur qui influencent le modèle le plus.
| worst_texture_lb | worst_texture_ub | value | std | count | |------------------|------------------|-----------|----------|---------| | -inf | 18.460 | 3.185128 | 8.479232 | 402.24 | | 18.460 | 19.300 | 3.160656 | 8.519873 | 402.39 | | 19.300 | 19.415 | 3.119814 | 8.489262 | 401.85 | | 19.415 | 20.225 | 3.101601 | 8.490439 | 402.55 | | 20.225 | 20.360 | 2.772929 | 8.711773 | 433.16 |
Tracé de fonctionnalités
https://preview.redd.it/cbmyl38y7oef1.png?width=1189&format=png&auto=webp&s=5c7657a74bdebf5c51332ddc856f5de3d5583de9
Tracé d’interaction en deux dimensions
L’intrigue montre comment la prédiction du modèle varie à l’autre d’une combinaison de valeur de deux fonctionnalités. Il met en évidence les régions où leur influence conjointe est la plus forte, révélant des interactions importantes.
https://preview.redd.it/2zb1ra5h8oef1.png?width=943&format=png&auto=webp&s=6b1149795ce202f50f47f0264013eb225e09de2c
Apprendre encore plus
Les commentaires et les contributions sont les bienvenus. Si vous travaillez sur l’interprétabilité du modèle, nous serions ravis d’entendre vos pensées.