Au-delà du lac: architecter le cloud de données ouvert et interopérable pour l’IA

Intelligence Artificielle
Noesis News
mai 30, 2025
0
104
8 minutes de lecture

L’IA dans l’entreprise est devenue un impératif stratégique pour chaque organisation, mais pour qu’elle soit vraiment efficace, les DSI doivent gérer la couche de données d’une manière qui peut soutenir les percées évolutives dans les modèles et les cadres de grande langue. Ils doivent aller au-delà de l’architecture de données traditionnelle qui est souvent rigide et cloisonnée, ce qui crée des obstacles directs à l’innovation de l’IA et à l’agilité compétitive.

C’est pourquoi il y a un pivot massif vers Ai à lac Open Open Powered Architectures. Construit sur des formats ouverts et des moteurs interopérables, l’architecture Open Lakehouse unifie des données structurées et non structurées dans une architecture flexible unique. Contrairement aux systèmes hérités, il élimine les silos et prend en charge l’accès en temps réel, ce qui permet de tout alimenter, de l’intelligence commerciale traditionnelle aux flux de travail avancés de l’IA et de l’apprentissage automatique.

The Open Data Foundation: Beyond Raw iceberg to Enterprise-Grade Control

Pendant des années, la vaste échelle des lacs de données a souvent abouti à des «marécages de données», sans gouvernance et performances critiques nécessaires aux charges de travail de qualité d’entreprise. Alors que des formats ouverts comme Apache Iceberg ont offert une percée en apportant une intégrité transactionnelle et une flexibilité de schéma au stockage du cloud, ils ont présenté un dilemme pour les DSI: adoptez l’ouverture au prix des capacités entièrement gérées, ou choisissez des services entièrement gérés et de l’interopérabilité de sacrifice.

Ces problèmes sont résolus par l’évolution actuelle du Lakehouse. Des plateformes comme Google Cloud sont élargies Biglake Offrez des fondations de données ouvertes de qualité en entreprise – élever iceberg à un format de stockage natif complet qui bénéficie de l’efficacité opérationnelle automatisée et de la gestion intégrée du cycle de vie des données sans sacrifier l’ouverture. Cela signifie que les organisations obtiennent le meilleur des deux mondes: la propriété complète des données et la flexibilité des normes ouvertes, combinées à l’expérience entièrement gérée et aux contrôles robustes exigés par leurs charges de travail les plus critiques.

Moteurs interopérables: alimenter chaque utilisateur sur la couche de données unifiée

Une valeur complète d’une fondation de données ouvertes émerge lorsqu’elle habilite tous les praticiens de données avec une véritable indépendance du moteur. Alors que les analystes ont besoin de SQL haute performance, les ingénieurs et les scientifiques utilisent Spark et Python pour l’analyse avancée et l’IA. Les DSI doivent s’assurer que ces diverses charges de travail utilisent systématiquement une seule copie de données partagée.

Les métastores d’exécution unifiées sont essentielles à cette interopérabilité. Un seul métastore sans serveur – comme le nouveau Biglake Metastoreconstruit sur des API standard ouvertes – sert de plan de contrôle central pour toutes les données. Il établit une seule source de vérité pour les schémas, la lignée et les contrôles d’accès pour simplifier considérablement la gouvernance des données et accélérer le délai de l’installation, et garantit un accès sécurisé et uniforme sur toutes les charges de travail. Il garantit que votre main-d’œuvre diversifiée peut tirer parti de leurs outils préférés, tous fonctionnant sur une couche de données cohérente et bien réglée.

Catalogues unifiés: de l’inventaire passif à l’intelligence active

Les catalogues de données traditionnels, simples inventaires passifs avec gouvernance dispersée, ne peuvent pas répondre à des demandes Open Lakehouse et IA. Les catalogues unifiés modernes, évolutifs et unifiés fournissent désormais une compréhension automatisée des données, une qualité proactive et une lignée pour l’IA de confiance et des métadonnées exploitables pour l’IA générative.

Les catalogues unifiés modernes (par exemple, le catalogue universel Dataplex de Google Cloud) utilisent l’IA pour cartographier les métadonnées à travers le domaine de données complet – des lits de lakehouses aux bases de données opérationnelles et aux modèles d’IA. Leurs «métadonnées actives» garantissent une gouvernance robuste, une lignée complète de données à Ai, une qualité de données élevée et une recherche sémantique puissante. Cette intelligence dynamique est également vitale pour ancrer les expériences de l’IA de nouvelle génération et établir une confiance fondamentale dans l’IA.

Bridging Operational and Analytical: déverrouillez le volant de l’activation

Une percée architecturale charnière est en cours, faisant plier les données opérationnelles et analytiques historiquement cloisonnées. Lorsque les processus ETL lents et coûteux ont provoqué des problèmes de la latence et de la duplication des données et ont entravé les décisions en temps réel et l’activation de l’IA, la maison moderne du lac Open se brise à travers ces silos.

En utilisant des formats ouverts sur le stockage unifié, les organisations tirent des informations analytiques et alimentent les opérations en temps réel à partir des mêmes données, éliminant le complexe ETL, le mouvement des données et les coûts associés tout en tirant parti de la richesse complète des données.

Cette fusion permet, par exemple, de détection de fraude en temps réel qui déclenche des mises à jour opérationnelles ou des agents d’IA qui fournissent des recommandations personnalisées instantanées à partir de données contextuelles riches. Une telle synergie opérationnelle-analytique opérationnelle sans couture sur une base ouverte et intelligente crée le «volant d’activation» – les données sont ingérées, analysées et immédiatement activées dans des flux de travail principaux. Cela crée un cycle d’auto-renforcement d’amélioration continue, d’innovation et de différenciation compétitive.

C’est la vraie promesse du cloud de données alimenté par l’IA: une fondation de données agile, intelligente et unifiée qui propulse les entreprises à l’ère de l’IA.

Prêt à architer votre cloud de données ouvert pour un retour sur investissement rapide? Google Cloud peut vous aider. Visite Ici pour plus d’informations.

Source link

Au-delà du lac: architecter le cloud de données ouvert et interopérable pour l’IA

The Open Data Foundation: Beyond Raw iceberg to Enterprise-Grade Control

Moteurs interopérables: alimenter chaque utilisateur sur la couche de données unifiée

Catalogues unifiés: de l’inventaire passif à l’intelligence active

Bridging Operational and Analytical: déverrouillez le volant de l’activation

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Arrêter d’écrire un python désordonné: un cours accidentel...

The best sunglasses for seniors in 2025, according...

40 mèmes hilarants relatables partagés sur le compte...

WELEVEL RAshes 5,7 millions de dollars au développement...

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

The Open Data Foundation: Beyond Raw iceberg to Enterprise-Grade Control

Moteurs interopérables: alimenter chaque utilisateur sur la couche de données unifiée

Catalogues unifiés: de l’inventaire passif à l’intelligence active

Bridging Operational and Analytical: déverrouillez le volant de l’activation

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags