Stability AI a dévoilé aujourd’hui plusieurs améliorations apportées à sa plateforme Stable Diffusion, élargissant ses capacités en matière de conversion texte-image et introduisant des fonctionnalités pour la création de contenu 3D.
Une mise à jour majeure est l’introduction du modèle Stable 3D, un changement significatif par rapport à l’orientation traditionnelle de la plateforme sur la génération d’images bidimensionnelles (2D). Cette nouvelle fonctionnalité facilite divers types de création de contenu 3D, allant du design graphique au développement de jeux vidéo.
En plus de son incursion dans la création de contenu 3D, Stability AI a lancé l’outil Sky Replacer, permettant aux utilisateurs de remplacer facilement le ciel dans les images 2D.
La plateforme propose désormais également le Stable Fine-Tuning, un outil conçu pour aider les entreprises à affiner rapidement les images pour des cas d’utilisation spécifiques.
De plus, la société prévoit d’intégrer un filigrane invisible dans les images produites via son API, assurant ainsi l’authenticité du contenu. Ces mises à jour visent à soutenir les flux de travail de développement créatif à mesure que l’utilisation de l’IA générative devient plus courante.
Emad Mostaque, PDG de Stability AI, a souligné dans une interview exclusive avec VentureBeat que l’objectif est de fournir aux professionnels de la création des outils avancés pour un contrôle accru de leur processus de création d’images.
Sommaire
Le remplacement du ciel n’est pas qu’une fonctionnalité, c’est un axe stratégique pour un cas d’utilisation professionnel
Bien que le concept de remplacement d’un arrière-plan dans une image ne soit pas nouveau, il a généralement nécessité des techniques d’IA non génératives telles que les écrans verts et les clés chromatiques. Cependant, Stability AI s’appuie sur ces techniques classiques et automatise le flux de travail pour rendre le processus rapide et efficace pour les utilisateurs professionnels. La fonctionnalité Sky Replacer, par exemple, peut être utile dans l’immobilier et d’autres industries où les utilisateurs ont besoin de différents arrière-plans avec des effets d’éclairage variés.
Selon Mostaque, offrir un contrôle aux utilisateurs est fondamental car différentes organisations ont leurs propres flux de travail pour générer des images et du contenu. Stability AI développe des flux de travail optimisés pour permettre le contrôle requis par différents cas d’utilisation. De plus, Sky Replacer n’est que la première d’une série de fonctionnalités spécifiques à l’industrie et à l’entreprise que la société prévoit de lancer, en fonction de ses expériences au cours des six à douze derniers mois. À mesure que le marché de la génération d’images à partir de texte devient de plus en plus concurrentiel, Stable AI a introduit de nouvelles fonctionnalités pour rester à la page. Les outils Firefly d’Adobe, qui sont étroitement intégrés à leur logiciel de design, ont fait leur entrée sur le marché, tandis que Midjourney a régulièrement ajouté de nouvelles fonctionnalités à sa technologie pour aider les designers à générer des images. OpenAI a également récemment lancé les modèles DALL-E 3, qui ont des capacités améliorées pour générer du texte dans les images.
Pour se différencier de ses concurrents, Stability AI prend plusieurs mesures. Son PDG, Mostaque, a souligné que l’entreprise s’éloigne désormais de la simple focalisation sur les modèles pour se concentrer davantage sur la facilitation d’un pipeline créatif. Avec les nouvelles fonctionnalités Sky Replacer et Fine Tuning, il a noté que l’entreprise va au-delà de ce qui est inclus dans un modèle de base pour la génération d’images.
De nouvelles fonctionnalités introduites par Stable Diffusion
Alors que le marché de la génération d’images à partir de texte devient de plus en plus concurrentiel, Stable AI a introduit de nouvelles fonctionnalités pour rester dans la course. Les outils Firefly d’Adobe, qui sont étroitement intégrés à leur logiciel de design, ont fait leur entrée sur le marché, tandis que Midjourney a régulièrement ajouté de nouvelles fonctionnalités à sa technologie pour aider les designers à générer des images. OpenAI a également récemment publié des modèles DALL-E 3, qui ont amélioré les capacités de génération de texte dans les images.
Pour se différencier de ses concurrents, Stability AI prend plusieurs mesures. Son PDG, Mostaque, a souligné que l’entreprise s’éloigne désormais de sa concentration uniquement sur les modèles pour se concentrer davantage sur la possibilité d’activer un flux de travail créatif. Avec les nouvelles fonctionnalités Sky Replacer et Fine Tuning, il a noté que la société va au-delà de ce qui est inclus dans un modèle de base pour la génération d’images.
Un réponse à une concurrence croissante
Préparez-vous à entrer dans un tout nouveau monde avec Stable 3D ! Stable AI a étendu le modèle de diffusion utilisé dans Stable Diffusion pour inclure des ensembles de données 3D supplémentaires et la vectorisation, créant ainsi Stable 3D. Le modèle permet de créer des mondes entiers en 3D, et il devrait être plus efficace que les approches traditionnelles de génération d’images 3D.
Stable 3D est construit à partir de Stable Diffusion et du travail de Stability AI sur Objaverse-XL, l’un des plus grands ensembles de données ouverts 3D au monde. Bien que la construction et le rendu d’images 3D aient été des processus nécessitant beaucoup de ressources par le passé, Stable 3D devrait changer la donne. Selon Mostaque, des choses qui prenaient beaucoup de temps à construire peuvent désormais être réalisées rapidement avec Stable 3D.
Bien qu’il en soit encore aux premiers stades, la technologie de Stable AI devrait évoluer et s’étendre au fil du temps. Pour l’instant, Stable 3D est disponible en aperçu privé. Ne manquez pas cette technologie révolutionnaire qui promet de bouleverser le monde de la génération d’images 3D !
Stabilité AI anticipe les mesures légales
Suite au décret exécutif de l’administration Biden sur l’IA, qui comprend une directive pour intégrer des filigranes dans le contenu généré, Stability AI prend des mesures. La société intègre désormais des filigranes invisibles et des Content Credentials dans son API, rejoignant ainsi un effort industriel multi-fournisseurs qui inclut Adobe et d’autres.
Selon Mostaque, l’ajout de filigranes invisibles et de Content Credentials est non seulement responsable, mais fait également partie d’un effort plus large visant à apporter de l’authenticité au contenu généré. La société est à l’avant-garde de plusieurs initiatives et investit dans des recherches supplémentaires pour distinguer le vrai du faux contenu. Ces efforts aideront également à l’attribution et à d’autres mécanismes que Stability AI intègre dans les futures versions.
Alors que le monde est confronté aux défis des fausses nouvelles et de la désinformation en ligne, les efforts de Stability AI pour authentifier le contenu généré sont particulièrement pertinents. Avec l’intégration de filigranes invisibles et de Content Credentials, la société fait un pas vers la garantie que le contenu que nous voyons en ligne est fiable et digne de confiance.