Flux (modèle texte-image)
Génère une image de toi tel que tu te représentes, Black Forest Labs
Créateur | Black Forest Labs |
---|---|
Première version | |
Dernière version | Flux 1.1 Pro (model)[1] () |
Dépôt | github.com/black-forest-labs/flux |
Type | Modèle texte-image |
Licence |
|
Site web | blackforestlabs.ai |
Flux (également connu sous le nom de FLUX.1) est un modèle texte-image développé par Black Forest Labs, basé à Fribourg-en-Brisgau, Allemagne. Black Forest Labs se fonde sur d'anciens employés de Stability AI. Comme les autres modèles de texte en image, Flux génère des images à partir de descriptions guidées en langage naturel, appelées prompts.
Histoire
Black Forest Labs se fonde en 2024 par Robin Rombach, Andreas Blattmann et Patrick Esser, d'anciens employés de Stability AI[2],[3]. Les trois fondateurs travaillent auparavant sur la génération d'images par intelligence artificielle à l'Université Louis-et-Maximilien de Munich en tant qu'assistants de recherche sous la direction de Björn Ommer[4],[5],[6]. Ils publient leurs résultats de recherche sur la génération d'images en 2022, ce qui conduit à la création de Stable Diffusion[6],[7]. Les investisseurs dans Black Forest Labs incluent la société de capital-risque Andreessen Horowitz, Brendan Iribe, Michael Ovitz, Garry Tan et Vladlen Koltun[8]. L'entreprise reçoit un investissement initial de 31 million[9],[10].
En août 2024, Flux s'intègre dans le chatbot Grok développé par xAI et se rend disponible en tant que fonctionnalité premium sur X[11],[12],[13],[14]. Grok change ensuite pour son propre modèle de texte en image Aurora en décembre 2024[15].
Le 18 novembre 2024, Mistral AI annonce que son chatbot Le Chat intègre Flux Pro en tant que modèle de génération d'images[16],[17].
Le 21 novembre 2024, Black Forest Labs annonce le lancement de Flux.1 Tools, une suite d'outils d'édition conçus pour être utilisés en complément des modèles Flux existants. Les outils comprennent Flux.1 Fill pour la inpainting et l'outpainting, Flux.1 Depth pour un contrôle basé sur la carte de disparité extraite des images d'entrée et des prompts, Flux.1 Canny pour un contrôle basé sur la détection des contours via filtre de Canny extraits des images d'entrée et des prompts, et Flux.1 Redux pour le mélange des images d'entrée existantes et des prompts. Chaque outil est disponible en version Dev et Pro[18],[19].
En janvier 2025, Black Forest Labs annonce un partenariat avec Nvidia pour l'inclusion des modèles Flux en tant que modèles de base pour la microarchitecture Blackwell de Nvidia[20]. L'entreprise annonce également le lancement de Flux Pro Finetuning API, conçu pour la personnalisation et le réglage fin des images générées par Flux, et un partenariat avec la société médiatique allemande Hubert Burda Media pour l'utilisation de Flux Pro dans le cadre de la création de contenu[21].
Modèles
Flux est une série de modèles de texte en image. Les modèles se basent sur une architecture hybride qui combine des blocs de transformateurs de diffusion multimodaux et parallèles, mis à l'échelle à 12 milliards de paramètres[8]. Les modèles se publient sous différentes licences, avec Schnell (signifiant "rapide" en langue allemande) publié en tant que logiciel open-source sous Licence Apache, Dev publié en tant que logiciel à source ouverte sous une licence non commerciale, et Pro publié en tant que logiciel propriétaire et uniquement accessible via une API pouvant être licenciée par des utilisateurs tiers[22],[23]. Les utilisateurs conservent la propriété des résultats générés, quel que soit le modèle utilisé[24],[25].
Les modèles se présentent soit en ligne, soit localement en utilisant des interfaces utilisateur d'IA générative telles que ComfyUI et Stable Diffusion WebUI Forge (un fork de Automatic1111 WebUI)[8],[26].
Un modèle phare amélioré, Flux 1.1 Pro, se publie le 2 October 2024[1],[27]. Deux modes additionnels se voient ajoutés le 6 November, Ultra qui peut générer des images à une résolution quatre fois supérieure et jusqu'à 4 mégapixels sans affecter la vitesse de génération, et Raw qui peut générer des images hyper-réalistes dans le style de la photographie candide[28],[29],[30].
En relation avec Flux se trouve le Modèle textuel-vidéo SOTA, en cours de développement en 2024[8].
Accueil
Selon un test effectué par Ars Technica, les résultats générés par Flux.1 Dev et Flux.1 Pro se comparent à DALL-E 3 en termes de fidélité aux prompts, avec un photoréalisme proche de Midjourney 6 et des mains humaines générées avec plus de cohérence par rapport aux modèles précédents tels que Stable Diffusion XL[31].
Flux fait l'objet de critiques pour ses images générées très réalistes. Selon des reportages médiatiques, les représentations vont d'une image de Donald Trump posant avec des armes à des scènes troublantes, ce qui déclenche des discussions sur les implications éthiques des technologies développées par Black Forest Labs[4],[13].
Après le lancement du modèle, les réseaux sociaux X se voient inonder d'images générées par Flux[32],[33]. Black Forest Labs ne fournit pas de détails exacts sur les données utilisées pour entraîner le modèle[28]. Ars Technica soupçonne que Flux se fonde sur une vaste collection non autorisée d'images récupérées sur le Web, une pratique controversée avec des conséquences juridiques potentielles[31],[34].
Intégrations tierces
Alors que Black Forest Labs n'offre pas d'accès direct à leurs modèles sur leur site web, les modèles Flux se retrouvent largement disponibles via diverses plateformes tierces pour un usage créatif et professionnel. Cela inclut des dépôts sur des plateformes telles que Hugging Face[35] et Replicate[36].
Références
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Flux » (voir la liste des auteurs).
- « Announcing FLUX1.1 [pro] and the BFL API », sur Black Forest Labs, (consulté le )
- ↑ Nicolas Killian, « Black Forest Labs: Sie sind ein Teil von jener Kraft », Die Zeit,
- ↑ (en) Matt Growcoot, « AI Image Generator Made by Stable Diffusion Inventors on Par With Midjourney and DALL-E », sur PetaPixel, (consulté le )
- (de) « Black Forest Labs unter Beschuss: Schockierende KI-Bilder sorgen für… », sur AlleAktien, (consulté le )
- ↑ (de) Ann Kathrin Hermes, « Black Forest Labs: KI-Tools aus dem Schwarzwald », sur trend.at, (consulté le )
- (de) Hannah Schwär, « Black Forest Labs: Die Schwarzwald-KI, auf die Elon Musk setzt », sur Capital.de, (consulté le )
- ↑ (en-US) « High-Resolution Image Synthesis with Latent Diffusion Models » [archive du ], sur Computer Vision & Learning Group (consulté le )
- (en-US) « Announcing Black Forest Labs » [archive du ], sur Black Forest Labs, (consulté le )
- ↑ (de) Jakob Steinschaden, « Black Forest Labs: 31 Mio. Dollar für Herausforderer von OpenAI und Midjourney » [archive du ], sur Trending Topics, (consulté le )
- ↑ (en-US) Michael Nuñez, « Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator » [archive du ], sur VentureBeat, (consulté le )
- ↑ (de) Frank Puscher, « Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen » [archive du ]
, sur MEEDIA (consulté le )
- ↑ (de) Luisa Bomke, « Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei » [archive du ], sur Handelsblatt (consulté le )
- (en) Jess Weatherbed, « xAI's new Grok-2 chatbots bring AI image generation to X » [archive du ], sur The Verge, (consulté le )
- ↑ Rachel Metz, « This Tiny Startup Is Helping Musk's Grok With Image Generation », Bloomberg News,
- ↑ (en) Wes Davis, « X gives Grok a new photorealistic AI image generator » [archive du ], sur The Verge, (consulté le )
- ↑ (en-US) « Mistral has entered the chat », sur Mistral AI, (consulté le )
- ↑ (en-US) Carl Franzen, « Mistral unleashes Pixtral Large and upgrades Le Chat into full-on ChatGPT competitor », sur VentureBeat, (consulté le )
- ↑ (en-US) « Introducing FLUX.1 Tools » [archive du ], sur Black Forest Labs, (consulté le )
- ↑ (en-US) Matthias Bastian, « Black Forest Labs expands FLUX.1 with four new AI tools for image editing » [archive du ], sur The Decoder, (consulté le )
- ↑ (en-US) Dean Takahashi, « Nvidia unveils AI foundation models running on RTX AI PCs » [archive du ], sur VentureBeat, (consulté le )
- ↑ (en-US) Carl Franzen, « You can now fine-tune your own version of AI image maker Flux with just 5 images » [archive du ], sur VentureBeat, (consulté le )
- ↑ (en-US) « Get Flux » [archive du ], sur Black Forest Labs (consulté le )
- ↑ (en-US) Kyle Wiggers, « Black Forest Labs, the startup behind Grok's image generator, releases an API » [archive du ], sur TechCrunch, (consulté le )
- ↑ (en) « flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux » [archive du ], sur GitHub (consulté le ) : « "Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model." »
- ↑ « API Agreement - BFL Docs (Pro) » [archive du ], sur Black Forest Labs, (consulté le ) : « Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters. »
- ↑ (ja) 田口和裕, « 話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6) », sur ASCII.jp, ASCII Media Works, (consulté le )
- ↑ (en-US) Carl Franzen, « Black Forest Labs releases Flux 1.1 Pro and an API », sur VentureBeat, (consulté le )
- (en) Matt Growcoot, « Flux AI Introduces Raw Mode That 'Captures the Genuine Feel of Candid Photography' », sur PetaPixel, (consulté le )
- ↑ (en-US) Matthias Bastian, « Flux 1.1 Pro AI image model adds "amateur" RAW photo mode and 4K image generation », sur The Decoder, (consulté le )
- ↑ (en-US) « Introducing FLUX1.1 [pro] Ultra and Raw Modes » [archive du ], sur Black Forest Labs, (consulté le )
- (en-US) Benj Edwards, « FLUX: This new AI image generator is eerily good at creating human hands », sur Ars Technica, (consulté le )
- ↑ (en-US) Maxwell Zeff, « Meet Black Forest Labs, the startup powering Elon Musk's unhinged AI image generator » [archive du ], sur TechCrunch, (consulté le )
- ↑ (de) Matthias Schwarzer, « Drogen, Bomben und Gewalt: KI-Bildgenerator von Elon Musk zeigt alles – mit deutscher Technik », sur RND.de, (consulté le )
- ↑ (de) Christoph Künne, « FLUX.1: Neuer KI-Bildgenerator » [archive du ], sur DOCMA, (consulté le )
- ↑ « Black Forest Labs on Hugging Face » [archive du ], sur Hugging Face (consulté le )
- ↑ « Flux Collection on Replicate » [archive du ], sur Replicate (consulté le )
Liens externes