Feuille de triche Kaggle CLI – Kdnuggets

 Feuille de triche Kaggle CLI – Kdnuggets


Feuille de triche Kaggle CLI
Image par auteur

Le Kaggle CLI (interface de ligne de commande) vous permet d’interagir avec les ensembles de données, les compétitions, les ordinateurs portables et les modèles de Kaggle directement à partir de votre terminal. Ceci est utile pour automatiser les téléchargements, les soumissions et la gestion des ensembles de données sans avoir besoin d’un navigateur Web. La plupart de mes workflows d’action GitHub utilisent Kaggle CLI pour télécharger ou pousser des ensembles de données, car c’est le moyen le plus rapide et le plus efficace.

1. Installation et configuration

Assurez-vous que Python 3.10+ soit installé. Ensuite, exécutez la commande suivante dans votre terminal pour installer l’API officielle Kaggle:

Pour obtenir vos informations d’identification Kaggle, téléchargez le fichier kaggle.json à partir des paramètres de votre compte Kaggle en cliquant sur «Créer un nouveau jeton».

Ensuite, définissez les variables d’environnement dans votre système local:

  • Kaggle_username =
  • Kaggle_api_key =

2. Concours

Les compétitions de Kaggle sont des défis hébergés où vous pouvez résoudre les problèmes d’apprentissage automatique, télécharger des données, soumettre des prédictions et voir vos résultats sur le classement.

La CLI vous aide à tout automatiser: naviguer dans les concours, télécharger des fichiers, soumettre des solutions, etc.

Liste des compétitions

kaggle competitions list -s 

Affiche une liste de compétitions de Kaggle, éventuellement filtrées par un terme de recherche. Utile pour découvrir de nouveaux défis à rejoindre.

Réservez les fichiers de concours

kaggle competitions files 

Affiche tous les fichiers disponibles pour une concurrence spécifique, vous savez donc quelles données sont fournies.

Télécharger les fichiers de concours

kaggle competitions download  (-f ) (-p )

Télécharge tous les fichiers ou les fichiers spécifiques d’un concours vers votre machine locale. Utilisez -f pour spécifier un fichier, -p pour définir le dossier de téléchargement.

Soumettre à un concours

kaggle competitions submit  -f  -m ""

Téléchargez votre fichier de solution dans un concours avec un message facultatif décrivant votre soumission.

Énumérez vos soumissions

kaggle competitions submissions 

Montre toutes vos soumissions précédentes pour un concours, y compris les scores et les horodatages.

Voir le classement

kaggle competitions leaderboard  (-s)

Affiche le classement actuel pour une compétition. Utilisez -S pour afficher uniquement les entrées supérieures.

3. ensembles de données

Les ensembles de données Kaggle sont des collections de données partagées par la communauté. Les commandes CLI de l’ensemble de données vous aident à trouver, télécharger et télécharger des ensembles de données, ainsi que gérer les versions de l’ensemble de données.

Énumérer les ensembles de données

Trouvez des ensembles de données sur Kaggle, éventuellement filtrés par un terme de recherche. Idéal pour découvrir des données pour vos projets.

Liste des fichiers dans un ensemble de données

Affiche tous les fichiers inclus dans un ensemble de données spécifiques, vous pouvez donc voir ce qui est disponible avant le téléchargement.

Télécharger les fichiers de l’ensemble de données

kaggle datasets download / (-f ) (--unzip)

Télécharge tous les fichiers ou les fichiers spécifiques à partir d’un ensemble de données. Utilisez –Unzip pour extraire automatiquement des fichiers zippés.

Initialiser les métadonnées de l’ensemble de données

Crée un fichier de métadonnées dans un dossier, en le préparant pour la création ou le versioning de l’ensemble de données.

Créer un nouvel ensemble de données

kaggle datasets create -p 

Télécharge un nouvel ensemble de données à partir d’un dossier contenant vos données et métadonnées.

Créer une nouvelle version d’ensemble de données

kaggle datasets version -p  -m ""

Télécharge une nouvelle version d’un ensemble de données existant, avec un message décrivant les modifications.

4. cahiers

Les ordinateurs portables Kaggle sont des extraits de code exécutables ou des ordinateurs portables. La CLI vous permet d’énumérer, de télécharger, de télécharger et de vérifier l’état de ces cahiers, qui est utile pour partager ou automatiser l’analyse.

Lister les grains

FINDS PUBLIC KAGGLE HODEBOOKS (grains) correspondant à votre terme de recherche.

Obtenir le code du noyau

Télécharge le code pour un noyau spécifique à votre machine locale.

Initialiser les métadonnées du noyau

Crée un fichier de métadonnées dans un dossier, en le préparant pour la création ou les mises à jour du noyau.

Mettre à jour le noyau

Télécharge un nouveau code et exécute le noyau, le mettant à jour sur Kaggle.

Obtenir la sortie du noyau

kaggle kernels output / -p 

Télécharge les fichiers de sortie générés par une exécution du noyau.

Vérifier l’état du noyau

Affiche l’état actuel (par exemple, en cours d’exécution, complet, échoué) d’un noyau.

5. Modèles

Les modèles Kaggle sont des modèles d’apprentissage automatique versé que vous pouvez partager, réutiliser ou déployer. La CLI aide à gérer ces modèles, de la liste et du téléchargement à leur création et à leur mise à jour.

Modèles de liste

Trouvez des modèles publics sur Kaggle correspondant à votre terme de recherche.

Obtenez un modèle

Télécharge un modèle et ses métadonnées sur votre machine locale.

Initialiser les métadonnées du modèle

Crée un fichier de métadonnées dans un dossier, le préparant à la création de modèles.

Créer un nouveau modèle

Télécharge un nouveau modèle sur Kaggle à partir de votre dossier local.

Mettre à jour un modèle

Télécharge une nouvelle version d’un modèle existant.

Supprimer un modèle

Supprime un modèle de Kaggle.

6. Config

Les commandes de configuration de Kaggle CLI contrôlent les comportements par défaut, tels que les emplacements de téléchargement et votre concours par défaut. Ajustez ces paramètres pour rendre votre flux de travail plus fluide.

Afficher la configuration

Affiche vos paramètres actuels de configuration Kaggle CLI (par exemple, concours par défaut, chemin de téléchargement).

Définir la configuration

Définit une valeur de configuration, telle que la concurrence par défaut ou le chemin de téléchargement.

Configuration non défini

Supprime une valeur de configuration, revenant au comportement par défaut.

7. Conseils

  • Utiliser -h ou –help après toute commande pour des options et une utilisation détaillés
  • Utiliser -V pour la sortie CSV, -Q pour le mode silencieux
  • Vous devez accepter les règles de concours sur le site Web de Kaggle avant de télécharger ou de vous soumettre à des concours

Abid Ali Awan (@ 1abidaliawan) est un professionnel certifié des data scientifiques qui aime construire des modèles d’apprentissage automatique. Actuellement, il se concentre sur la création de contenu et la rédaction de blogs techniques sur l’apprentissage automatique et les technologies de science des données. Abid est titulaire d’une maîtrise en gestion technologique et d’un baccalauréat en génie des télécommunications. Sa vision est de construire un produit d’IA en utilisant un réseau de neurones graphiques pour les étudiants aux prises avec une maladie mentale.



Source link

Related post