Black Forest Labs, kelompok yang membantu dalam pembuatan Stable Diffusion yang asli, telah merilis Flux, model teks-ke-gambar sumber terbuka terbesar hingga saat ini. Dengan 12 miliar parameter yang mengejutkan, Flux memiliki kemampuan untuk menghasilkan visual yang mengalahkan Midjourney dan mungkin mengalahkan model lain, baik tertutup maupun terbuka yang saat ini tersedia.

Tiga versi Flux tersedia: Flux Pro, versi sumber tertutup yang tersedia melalui API; Flux Schnell, versi yang lebih cepat, versi yang disaring yang beroperasi sepuluh kali lebih cepat, tersedia di bawah lisensi Apache 2 dan merupakan model yang paling canggih; dan Flux Dev, versi sumber terbuka dengan lisensi non-komersial untuk pengembangan komunitas.

Di Hugging Face, Anda dapat mengunduh Flux Dev dan Flux Schnell. Selain itu, ComfyUI telah diperbarui untuk mendukung model baru dalam alur kerja lokal.

Dalam pengumumannya pada hari Kamis, Black Forest Labs menekankan rekam jejak tim yang telah terbukti dalam pengembangan AI generatif untuk media.

“Adversarial Diffusion Distillation untuk sintesis gambar yang sangat cepat dan real-time; model Stabilitas AI Stable Diffusion untuk pembuatan gambar dan video (Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers), dan VQGAN dan Latent Diffusion adalah inovasi kami,” kata tim tersebut.

Setelah putaran pendanaan awal yang berhasil sebesar $31 juta, yang didirikan oleh Andreessen Horowitz dan didukung oleh para investor terkenal seperti Brendan Iribe, Michael Ovitz, dan Garry Tan, peluncuran ini diikuti.

Flux menyatakan dalam pengujian benchmarking bahwa modelnya telah menetapkan standar baru dalam sintesis gambar; dalam hal keragaman output, variabilitas ukuran/aspek, kualitas visual, kecepatan mengikuti, dan variabilitas ukuran/aspek, Flux melampaui model seperti Dall-E 3 (HD), Midjourney v6.0, dan SD3 Ultra.

Grafik Black Forest menyatakan bahwa model Pro dan Dev-nya merupakan generator gambar terbaik hingga saat ini; Schnell, yang kurang bertenaga, berada di antara Ideogram dan Midjourney v5.

!https://medium.com