Feuille de triche Kaggle CLI – Kdnuggets


Image par auteur
Le Kaggle CLI (interface de ligne de commande) vous permet d’interagir avec les ensembles de données, les compétitions, les ordinateurs portables et les modèles de Kaggle directement à partir de votre terminal. Ceci est utile pour automatiser les téléchargements, les soumissions et la gestion des ensembles de données sans avoir besoin d’un navigateur Web. La plupart de mes workflows d’action GitHub utilisent Kaggle CLI pour télécharger ou pousser des ensembles de données, car c’est le moyen le plus rapide et le plus efficace.
1. Installation et configuration
Assurez-vous que Python 3.10+ soit installé. Ensuite, exécutez la commande suivante dans votre terminal pour installer l’API officielle Kaggle:
Pour obtenir vos informations d’identification Kaggle, téléchargez le fichier kaggle.json à partir des paramètres de votre compte Kaggle en cliquant sur «Créer un nouveau jeton».
Ensuite, définissez les variables d’environnement dans votre système local:
- Kaggle_username =
- Kaggle_api_key =
- Kaggle_api_key =
2. Concours
Les compétitions de Kaggle sont des défis hébergés où vous pouvez résoudre les problèmes d’apprentissage automatique, télécharger des données, soumettre des prédictions et voir vos résultats sur le classement.
La CLI vous aide à tout automatiser: naviguer dans les concours, télécharger des fichiers, soumettre des solutions, etc.
Liste des compétitions
kaggle competitions list -s
Affiche une liste de compétitions de Kaggle, éventuellement filtrées par un terme de recherche. Utile pour découvrir de nouveaux défis à rejoindre.
Réservez les fichiers de concours
kaggle competitions files
Affiche tous les fichiers disponibles pour une concurrence spécifique, vous savez donc quelles données sont fournies.
Télécharger les fichiers de concours
kaggle competitions download (-f ) (-p )
Télécharge tous les fichiers ou les fichiers spécifiques d’un concours vers votre machine locale. Utilisez -f pour spécifier un fichier, -p pour définir le dossier de téléchargement.
Soumettre à un concours
kaggle competitions submit -f -m ""
Téléchargez votre fichier de solution dans un concours avec un message facultatif décrivant votre soumission.
Énumérez vos soumissions
kaggle competitions submissions
Montre toutes vos soumissions précédentes pour un concours, y compris les scores et les horodatages.
Voir le classement
kaggle competitions leaderboard (-s)
Affiche le classement actuel pour une compétition. Utilisez -S pour afficher uniquement les entrées supérieures.
3. ensembles de données
Les ensembles de données Kaggle sont des collections de données partagées par la communauté. Les commandes CLI de l’ensemble de données vous aident à trouver, télécharger et télécharger des ensembles de données, ainsi que gérer les versions de l’ensemble de données.
Énumérer les ensembles de données
Trouvez des ensembles de données sur Kaggle, éventuellement filtrés par un terme de recherche. Idéal pour découvrir des données pour vos projets.
Liste des fichiers dans un ensemble de données
Affiche tous les fichiers inclus dans un ensemble de données spécifiques, vous pouvez donc voir ce qui est disponible avant le téléchargement.
Télécharger les fichiers de l’ensemble de données
kaggle datasets download / (-f ) (--unzip)
Télécharge tous les fichiers ou les fichiers spécifiques à partir d’un ensemble de données. Utilisez –Unzip pour extraire automatiquement des fichiers zippés.
Initialiser les métadonnées de l’ensemble de données
Crée un fichier de métadonnées dans un dossier, en le préparant pour la création ou le versioning de l’ensemble de données.
Créer un nouvel ensemble de données
kaggle datasets create -p
Télécharge un nouvel ensemble de données à partir d’un dossier contenant vos données et métadonnées.
Créer une nouvelle version d’ensemble de données
kaggle datasets version -p -m ""
Télécharge une nouvelle version d’un ensemble de données existant, avec un message décrivant les modifications.
4. cahiers
Les ordinateurs portables Kaggle sont des extraits de code exécutables ou des ordinateurs portables. La CLI vous permet d’énumérer, de télécharger, de télécharger et de vérifier l’état de ces cahiers, qui est utile pour partager ou automatiser l’analyse.
Lister les grains
FINDS PUBLIC KAGGLE HODEBOOKS (grains) correspondant à votre terme de recherche.
Obtenir le code du noyau
Télécharge le code pour un noyau spécifique à votre machine locale.
Initialiser les métadonnées du noyau
Crée un fichier de métadonnées dans un dossier, en le préparant pour la création ou les mises à jour du noyau.
Mettre à jour le noyau
Télécharge un nouveau code et exécute le noyau, le mettant à jour sur Kaggle.
Obtenir la sortie du noyau
kaggle kernels output / -p
Télécharge les fichiers de sortie générés par une exécution du noyau.
Vérifier l’état du noyau
Affiche l’état actuel (par exemple, en cours d’exécution, complet, échoué) d’un noyau.
5. Modèles
Les modèles Kaggle sont des modèles d’apprentissage automatique versé que vous pouvez partager, réutiliser ou déployer. La CLI aide à gérer ces modèles, de la liste et du téléchargement à leur création et à leur mise à jour.
Modèles de liste
Trouvez des modèles publics sur Kaggle correspondant à votre terme de recherche.
Obtenez un modèle
Télécharge un modèle et ses métadonnées sur votre machine locale.
Initialiser les métadonnées du modèle
Crée un fichier de métadonnées dans un dossier, le préparant à la création de modèles.
Créer un nouveau modèle
Télécharge un nouveau modèle sur Kaggle à partir de votre dossier local.
Mettre à jour un modèle
Télécharge une nouvelle version d’un modèle existant.
Supprimer un modèle
Supprime un modèle de Kaggle.
6. Config
Les commandes de configuration de Kaggle CLI contrôlent les comportements par défaut, tels que les emplacements de téléchargement et votre concours par défaut. Ajustez ces paramètres pour rendre votre flux de travail plus fluide.
Afficher la configuration
Affiche vos paramètres actuels de configuration Kaggle CLI (par exemple, concours par défaut, chemin de téléchargement).
Définir la configuration
Définit une valeur de configuration, telle que la concurrence par défaut ou le chemin de téléchargement.
Configuration non défini
Supprime une valeur de configuration, revenant au comportement par défaut.
7. Conseils
- Utiliser -h ou –help après toute commande pour des options et une utilisation détaillés
- Utiliser -V pour la sortie CSV, -Q pour le mode silencieux
- Vous devez accepter les règles de concours sur le site Web de Kaggle avant de télécharger ou de vous soumettre à des concours
Abid Ali Awan (@ 1abidaliawan) est un professionnel certifié des data scientifiques qui aime construire des modèles d’apprentissage automatique. Actuellement, il se concentre sur la création de contenu et la rédaction de blogs techniques sur l’apprentissage automatique et les technologies de science des données. Abid est titulaire d’une maîtrise en gestion technologique et d’un baccalauréat en génie des télécommunications. Sa vision est de construire un produit d’IA en utilisant un réseau de neurones graphiques pour les étudiants aux prises avec une maladie mentale.