Que sont les modèles de diffusion? | Techradar

Les modèles de diffusion ont explosé sur la scène mondiale il y a à peine deux ans. La technologie existait depuis un certain temps, mais ce n’est que lorsque nous avons tous vécu la révolution de la génération d’images de l’IA qu’elle est devenue un point de vue.
Soudain, tout le monde et leur chien pouvaient créer des œuvres d’art simplement en tapant une invite dans une zone de texte.
Mais les modèles de diffusion ne concernent pas seulement l’art et la création d’images. Le monde scientifique, la musique et même Hollywood, ont commencé à comprendre les avantages de cette puissante technologie d’IA.
Comment ça marche?
La diffusion fonctionne en ajoutant du bruit aux données d’entraînement jusqu’à ce qu’elle devienne complètement méconnaissable, puis en inversant le processus pour créer de nouvelles données à partir des apprentissages originaux.
C’est un peu comme un sculpteur «découvrant» leur vision en saillant lentement le bois de pierre ou le plâtre devant eux.
Le bit intelligent est d’enseigner au modèle d’IA pour comprendre comment recréer une nouvelle version des données d’origine en soustrayant le bruit jusqu’à ce que le résultat souhaité arrive à «concentration».
La diffusion est l’un des concepts d’IA les plus difficiles à expliquer au profane. Lorsque les gens parlent de vol d’art ou de musique, ce qu’ils ne réalisent pas, ce sont les modèles de diffusion qui fournissent ces résultats miraculeux, n’agissent pas directement sur les données de formation originales, mais utilisent ces données comme point de départ pour créer quelque chose de complètement nouveau et unique.
Donnez au modèle une image d’un chat noir et à partir de ce point, le modèle apprendra à recréer une image similaire avec des variations infinies, simplement en utilisant ce processus de diffusion et de réduction du bruit.
L’une des principales forces des modèles de diffusion est leur capacité à travailler sans avoir besoin de données d’entraînement structurées.
Cela les rend extrêmement polyvalents, car au lieu de compter sur des exemples clairement étiquetés, un modèle de diffusion apprend à recréer du contenu en comprenant comment débarrasser et restructurer les données de formation originales qui leur ont été données.
Parce que le bruit peut être infiniment complexe, le résultat final peut également être incroyablement complexe. D’où leur application non seulement dans l’art, mais aussi la musique, la science et d’autres domaines qui nécessitent un traitement complexe d’IA.
Les architectes utilisent aujourd’hui de plus en plus des modèles de diffusion pour visualiser les nouveaux styles de construction, tandis que les créateurs de mode peuvent jouer instantanément avec de nouveaux concepts de vêtements.
L’un des domaines les plus précieux pour ces modèles est dans le domaine de la recherche médicale, où les techniques de diffusion sont de plus en plus utilisées pour accélérer et améliorer l’imagerie diagnostique.
La capacité de reconnaître et d’identifier instantanément les modèles dans des images complexes rend ces modèles parfaits pour diagnostiquer des conditions médicales autrement cachées ou obscures.
L’inconvénient de ce type de puissance est la nécessité d’ordinateurs de plus en plus sophistiqués et puissants pour effectuer le processus de débarras.
Les ordinateurs à faible puissance entraînent inévitablement des temps de génération inacceptablement plus lents.
Les modèles de diffusion dépendent également très de l’entrée de données d’entraînement de haute qualité, ce qui est un cas de déchets, des ordures. Il y a aussi la question du biais des données d’entrée, ce qui peut conduire à des résultats aberrants à moins que le modèle ne soit correctement formé au fil du temps.
Ce type d’IA génératif est désormais sur le point de livrer une vidéo AI qui est presque identique au contenu généré par l’homme.
Cependant Vidéos DeepFake Et d’autres contenus malveillants sont un problème croissant sur Internet, tout comme les abus d’auteur et le contenu généré synthétiquement conçu pour aider à l’activité criminelle dans un large éventail de domaines.
Malgré ces défis, les modèles de diffusion vont jouer un rôle de plus en plus important dans notre vie moderne. Les avantages créatifs et fonctionnels d’avoir ce type d’assistance en matière d’IA à Tap se révèle être une véritable révolution dans presque tous les domaines auxquels nous pouvons penser.