À l’intérieur de la guerre entre Genai et Internet – Computerworld

Riposter
Cloudflare est maintenant délibérément empoisonné modèle de grande langue (LLM) Données de formation, riposter contre les sociétés de l’IA qui prennent des données sur les sites Web sans autorisation. (La société propose des réseaux de livraison de contenu, de la cybersécurité, de l’atténuation des DDOS et de l’optimisation des performances Web.)
Voici le problème que CloudFlare essaie de résoudre: des entreprises comme Openai, Anthropiqueet Perplexité ont été accusés de récolte des données sur des sites Web, d’ignorer les fichiers robots.txt sur les sites (à l’origine conçus pour indiquer les moteurs de recherche quels fichiers étaient interdits pour l’indexation) et la prise de données de toute façon. En plus de ces grands noms, toutes sortes d’entreprises plus petites et moins légitimes capturent des données sans l’autorisation des propriétaires légitimes.
La solution de Cloudflare est une fonctionnalité disponible pour tous les clients appelés «AI Labyrinthe. » Le programme redirige les robots entrants vers ses propres sites Web à usage spécial, qui sont remplis d’énormes quantités d’informations facultatives mais non pertinentes (non pertinentes pour le site Web cible).