Début avec Cassandra: Guide d’installation et de configuration

 Début avec Cassandra: Guide d’installation et de configuration


Début avec Cassandra: Guide d'installation et de configuration Image par auteur

Introduction

Apache Cassandra est un système de base de données NOSQL distribué et open source conçu pour gérer des quantités massives de données sur plusieurs serveurs pour garantir la haute disponibilité et les performances. Il est connu pour son évolutivité horizontale dans les applications où la fiabilité, la vitesse et la disponibilité sont importantes. Ce guide vous guidera à travers le processus d’installation et de configuration de Cassandra sur Linux, Fenêtreet macos. Il vous montrera comment configurer votre système, vous connecter à Cassandra Shell et vous préparer à gérer les données à grande échelle.

Développé à l’origine par Facebook et adopté plus tard par le Fondation du logiciel ApacheCassandra est connu pour gérer d’énormes quantités de données sur plusieurs serveurs sans un seul point d’échec. Il utilise un mécanisme de stockage de données unique appelé stockage de données modèle. C’est « Peer-to-Peer » ce qui signifie qu’il n’y a pas de serveur central dans le système. Chaque nœud est tout aussi important. Cette approche permet à Cassandra de fournir une excellente tolérance aux défauts et est idéale pour les applications qui nécessitent une disponibilité constante et une accessibilité rapide des données, telles que le commerce électronique, l’analyse en temps réel et l’IoT.

Architecture et caractéristiques clés

L’architecture distribuée de Cassandra, distribuée, élimine les points de défaillance uniques et permet une mise à l’échelle horizontale transparente, ce qui le rend idéal pour les applications critiques de mission nécessitant une disponibilité constante. En utilisant un modèle de cohérence accordable, Cassandra offre une flexibilité pour équilibrer la latence et la précision des données par requête, pour répondre à un large éventail de besoins d’application, des recherches rapides au traitement des commandes sécurisé. Son modèle de données colonnes prend en charge les écritures à grande vitesse, en particulier bénéfiques pour gérer les données à grande vitesse dans les bases de données IoT, l’agrégation de journaux et les séries chronologiques. L’ajout de nœuds à un cluster Cassandra est simple, car le système gère automatiquement la distribution des données, garantissant une mise à l’échelle et un équilibre des données efficaces sur le réseau.

Cas d’utilisation et intégration dans les écosystèmes de Big Data

Connu pour alimenter les recommandations en temps réel, les plateformes d’analyse et les systèmes de stockage décentralisés, Cassandra est largement adoptée dans des industries comme les médias sociaux, les finances et les télécommunications, où l’accès rapide aux données et la fiabilité sont essentiels. De plus, Cassandra s’intègre en douceur aux outils de Big Data tels que Apache Spark et Apache Kafka, ce qui en fait un excellent choix pour les pipelines de données en temps réel qui exigent des capacités de traitement et de stockage haute performance.

Que vous travailliez avec des données de séries chronologiques, la gestion d’un grand ensemble de données ou la création d’applications qui exigent le traitement des données en temps réel, Cassandra offre une solution robuste avec sa conception haute performance, évolutive et décentralisée.

Condition préalable

Pour installer et configurer Cassandra, veuillez vous assurer de répondre aux exigences suivantes:

  • Connaissance de base de la ligne de commande: Une certaine familiarité avec l’utilisation de la ligne de commande simplifiera le processus de configuration
  • Compatibilité du système d’exploitation: Vous devriez faire fonctionner un système:
    • Linux (Ubuntu / Debian ou Red Hat / Rocky Linux)
    • Windows (en utilisant le sous-système Windows pour Linux)
    • macos
  • Connexion Internet: Requis pour télécharger Cassandra et autres dépendances
  • Privilèges de l’administrateur: Vous aurez besoin de l’autorisation pour installer un logiciel sur votre système, en particulier sur les systèmes Windows et Linux

Guide étape par étape pour l’installation

Installation de Cassandra sur Linux

Commençons par installer Cassandra sur des distributions Linux telles que Ubuntu / Debian et Red Hat / Rocky.

Installez sur Ubuntu / Debian

  • Installer Java: Cassandra nécessite Java, alors commencez par installer OpenJDK. Ouvrez votre terminal et courez:
sudo apt update
sudo apt install openjdk-11-jdk
  • Vérifiez l’installation en vérifiant la version Java:
  • Ajoutez le référentiel Cassandra: Pour utiliser la dernière version stable, ajoutez le référentiel Cassandra:
echo "deb https://www.apache.org/dist/cassandra/debian 40x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
  • Ajouter la clé GPG: La clé de référentiel de Cassandra est requise pour une installation sécurisée:
curl https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
  • Mettre à jour la liste des packages et installer Cassandra: Maintenant, mettez à jour votre liste de packages et installez Cassandra:
sudo apt update
sudo apt install cassandra
  • Commencez et activez Cassandra: Cassandra devrait démarrer automatiquement. Pour le démarrer manuellement, utilisez:
sudo systemctl start cassandra
  • Permettez à Cassandra de démarrer sur Boot avec:
sudo systemctl enable cassandra

Installer sur Red Hat / Rocky Linux

  • Installer Java: Comme avec Ubuntu, vous devrez d’abord installer Java:
sudo systemctl enable cassandra
  • Ajoutez le référentiel Cassandra:
sudo nano /etc/yum.repos.d/cassandra.repo
  • Ajoutez les lignes suivantes dans le fichier et enregistrez:
(cassandra)
name=Apache Cassandra
baseurl=https://www.apache.org/dist/cassandra/redhat/40x/
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://www.apache.org/dist/cassandra/KEYS
  • Installez Cassandra: Mettez à jour l’index du référentiel et installez Cassandra:
sudo yum install cassandra
  • Commencez et activez Cassandra: Démarrez le service Cassandra et activez-le de lancer sur Boot:
sudo systemctl start cassandra
sudo systemctl enable cassandra

Installation de Cassandra sur Windows

Pour installer Cassandra sur Windows, nous utiliserons le sous-système Windows pour Linux (WSL).

  • Configurez WSL et installez Ubuntu et redémarrez votre ordinateur si vous êtes invité:

Activer WSL2: Assurez-vous que vous exécutez Windows 10 version 2004 ou supérieur ou Windows 11. Ouvrez PowerShell en tant qu’administrateur et activez WSL

  • Installez Ubuntu via le Microsoft Store: Téléchargez et installez Ubuntu à partir du Microsoft Store. Après l’installation, ouvrez Ubuntu pour terminer la configuration
  • Installez Cassandra dans Ubuntu (via WSL): Une fois que vous avez fonctionné dans WSL, installez Java
sudo apt update
sudo apt install openjdk-11-jdk
  • Ajoutez le référentiel et la clé Cassandra:
echo "deb https://www.apache.org/dist/cassandra/debian 40x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
curl https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
sudo apt update
sudo apt install cassandra
sudo service cassandra start
  • Testez l’installation: pour tester que Cassandra est en cours d’exécution, connectez-vous à la coquille Cassandra (CQLSH) et exécutez une commande

Vous devriez voir l’invite de coquille de Cassandra (CQLSH>) apparaissent, indiquant une connexion réussie.

Installation de Cassandra sur macOS

Le moyen le plus simple d’installer Cassandra sur MacOS est d’utiliser Homebrew. S’assurer Homebrew est installé sur votre système. Si ce n’est pas le cas, installez-le en fonctionnant:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
  • Installer Java: Cassandra nécessite Java, alors d’abord, assurez-vous qu’il est installé via Homebrew:
  • Démarrer Cassandra: Cassandra ne démarre pas automatiquement. Vous pouvez le démarrer avec:
brew services start cassandra
  • Testez l’installation: Pour vérifier que Cassandra est en cours d’exécution, ouvrez la coque Cassandra:

Tapez Ping pour vérifier la connexion. Si le shell répond par une invite, votre installation est réussie.

Gérer Cassandra

Avec Cassandra en cours d’exécution, vous pouvez commencer, l’arrêter ou le redémarrer comme suit:

sudo systemctl start cassandra
sudo systemctl stop cassandra
sudo systemctl restart cassandra

Conclusion

Dans ce guide, vous avez appris à installer et à configurer Apache Cassandra sur Linux, Fenêtreet macos. Vous avez également appris à démarrer et à arrêter le service Cassandra, à vous connecter via cqlshet tester sa fonctionnalité. L’architecture entre pairs distribuée de Cassandra en fait une solution robuste et évolutive pour gérer des quantités massives de données.

Sa compatibilité avec différentes plates-formes du système d’exploitation le rend accessible à un large éventail d’utilisateurs. Une fois que Cassandra est opérationnelle, vous êtes prêt à explorer son riche ensemble de fonctionnalités pour gérer des données largement distribuées.

Shittu olumide est un ingénieur logiciel et un écrivain technique passionné de tirer parti des technologies de pointe pour créer des récits convaincants, avec un œil attentif pour les détails et un talent pour simplifier les concepts complexes. Vous pouvez également trouver Shittu sur Gazouillement.





Source link

Related post