画像生成AIの世界に、またしてもとてつもない怪物が放たれました。ドイツのBlack Forest Labsは2025年11月25日、同社の最新モデル「FLUX.2」を正式にリリースし、Hugging Faceにてその設計図にあたるウェイトを公開しました。
今回のFLUX.2、何がすごいかと言いますと、その「脳の大きさ」が桁違いです。前作のFLUX.1も非常に優秀でしたが、今回のモデルサイズはなんと320億パラメーター。これは一般的な家庭用PCで動く限界を攻めたサイズであり、その表現力はもはや実写の写真と区別がつかないレベル、いわゆる「4メガピクセル級」の超高解像度生成を実現しています。
技術的に非常に興味深いのは、ユーザーの指示文(プロンプト)を理解するパートに、テキスト生成AIとして定評のある「Mistral 3 Small」を採用した点です。これにより、「右手に赤いリンゴを持ち、左手で遠くを指差している」といった複雑な指示も、以前より遥かに正確に描き分けられるようになりました。
そして、クリエイターたちが最も歓喜しているのが「マルチリファレンス機能」の搭載です。これは最大10枚までの画像を参考資料としてAIに渡せる機能で、例えば自社製品の写真や、特定のキャラクターのスケッチを読み込ませれば、その特徴を完全に維持したまま、別のポーズや背景で新しい画像を生成できます。これまで「LoRA」と呼ばれる追加学習が必要だった作業が、これ一つで解決してしまうかもしれない、まさに革命的な機能です。
ただし、この高性能には代償もあります。そのまま動かすには90GBものVRAMが必要となるため、事実上、業務用の巨大なGPUサーバーが必要です。しかしそこは抜け目なく、NVIDIAと協力して軽量化(FP8量子化)を行っており、最新のRTXシリーズなどのハイエンドな個人用GPUでもなんとか動かせるようチューニングされています。
Hugging Faceのブログでは、すでにこのモデルを使った開発コードが公開されており、世界中のエンジニアがこの新しい「画家の筆」をどう使いこなそうかと、今まさに熱狂している最中です。