iPad Workers

#157:画像生成が変わった!ChatGPT-4oのすごすぎる進化


Listen Later

👋 こんにちは、はるなです。

今日のテーマは「ChatGPTの画像生成の大きな変化について」です。

https://ipadworkers.substack.com/p/iwpodcast-157

* 📅4月7日発売📘iPadアプリ図鑑2025(予約限定価格499円)

🎧 iPad Workers Podcastは毎週、木曜日配信予定のポッドキャスト番組です。リクエスト・感想などは #iPadWorkersのハッシュタグを付けて投稿してください。

━━━━━━━━━━━━━━━━━━━

🖼️ ChatGPTの画像生成は何が変わったのか?

ChatGPTの画像生成エンジンが、これまでと大きく変わりました。これまでは「DALL·E 3」という外部エンジンを使っていましたが、3月25日頃からOpenAI自社製の「ChatGPT-4o Image Generation」に切り替わりました。

従来の「DALL·E 3」と比べて、以下のような点で大きく進化しています。

ChatGPT-4o Image Generationの特徴

* テキストを含む画像生成:看板やロゴなど、文字が入った画像も作成OK* キャラクターの固定:同じキャラクターのバリエーションが出せる* 画像スタイルの変換:「〇〇風」と伝えるだけで簡単にスタイル変更できる* 透過画像の生成:透明風ではなく透過PNGが生成できる

一部テキストがおかしいところはありますが、4つの特徴を画像化してほしいと頼んだだけで、上記画像が生成できます。

これまでの仕組みでは、ChatGPTがDALL·E 3用のプロンプトに翻訳して指示を出していましたが、新しい仕組みではChatGPTがネイティブに画像生成できるようになりました。

より簡単にイメージをビジュアル化することができます。

無料プランの人にも開放されている機能ですが、話題になってみんなが使いまくるから、OpenAI側のGPU負荷が激しくなりすぎて、無料プランの人は1日に3枚までという制限がかかっています。有料プランの人は短時間に連続して生成すると、「時間をあけてね」というメッセージが出ますが、生成枚数に制限はありません。

新しい画像生成モデルは、最初にボヤけた全体像が表示され、上から順番に画像が表示されていきます。

🈶 日本語もだいたい表現できるように

最も大きな変化は文字の生成、特に日本語が描画できるようになった点です。

これまでのDALL·E 3を使った画像生成では、テキストの描画が全くダメでした。特に日本語は意味不明な文字のようなものしか生成できません。アルファベットですらスペルミスが多く、あまり信用できませんでした。

新バージョンでは、ほぼ正確な日本語を生成できるようになりました。一部の漢字が崩れていますが、ほぼ実用レベルに達しています。

セミナー概要を送っただけで、この画像が作られてしまうのです。すごくないですか?

上記画像から少し調整をかけて完成したものがこちらです。画像編集ソフトは一切使わず、ChatGPTの画像生成のみで出したものです。(👉Obsidianセミナー詳細はこちら

セミナー概要を送っただけではあるんですが、送る時のフォーマットにコツがあるので、その雛形は土日のプロセス紹介ニュースレターで送ります。興味のある方はぜひプロプランへ。お試し期間もついてます。

雛形なしの状態でセミナー概要を送ると、こんな感じの画像しか生成できません。決して悪くはないけど、ちょっと足りない感じがします。

⚖️ 著作権の問題も

ChatGPTの画像生成アップデート、全般的にかなりいい感じなんですが、問題点もあります。著作権に関わる問題です。「ジブリ風」といった指示をすると、まるで本物のジブリ作品のようなイラストが生成されてしまいます。

特定のブランドロゴなども、これは完全にアウトなのでは?というレベルで描画されてしまう場合があります。一応、テキスト上は「できません」と言っていますが、生成された画像にはほぼそれとわかる形で描画されています。

こうしたグレーゾーンについては、生成AI業界全体で長く議論されていますが、まだ明確なルールが確立されていないのが現状です。特に「〇〇風」という曖昧な指示が許容される場合、それがどこまで許されるのかという線引きがとても難しくなります。

たとえば「ピカソ風」「葛飾北斎風」といった、すでに著作権が消滅したアーティストのスタイルを模倣することは、基本的に問題視されません。ですが、「ジブリ風」「ディズニー風」「ピクサー風」といった現役で権利が生きているスタジオのスタイルを真似た場合、それが “創作的なオマージュ”とされるのか、“著作権侵害の疑いがある模倣”と見なされるのかは非常にグレー です。

AIにとってスタイルは、膨大なデータの中から抽出した「傾向の集合体」に過ぎません。しかし、人間の目から見ると、明らかに「あのキャラみたい」「あのアニメっぽい」と感じてしまうのも事実です。

AIが生成した画像を利用する場合、思わぬところでトラブルになる可能性があるため注意は必要です。クリエイターとして活動している身としては、この辺りの法整備や明確なガイドラインが必要だと感じています。ただ、個人で楽しむ分にはとても魅力的なものであることは間違いありません。

ChatGPTの新しい画像生成機能は、iPhoneやiPadのChatGPTアプリでも使用可能です。ChatGPT-4oモデルを選択した状態で「画像を作って」と言うと、新しい画像生成モデルで画像生成ができます。

ということで今日は「ChatGPTの画像生成モデルが新しくなってすごい使えるようになった」というお話でした。

👇4月7日発売『📘iPadアプリ図鑑2025』予約受付中。2024年版からめちゃくちゃボリュームアップしてます!



This is a public episode. If you'd like to discuss this with other subscribers or get access to bonus episodes, visit ipadworkers.substack.com/subscribe
...more
View all episodesView all episodes
Download on the App Store

iPad WorkersBy はるな👠iPad Worker


More shows like iPad Workers

View all
Apple News Radio ワンボタンの声 by ワンボタンの声制作委員会

Apple News Radio ワンボタンの声

8 Listeners

Rebuild by Tatsuhiko Miyagawa

Rebuild

52 Listeners

backspace.fm by backspace.fm

backspace.fm

12 Listeners

石川温のスマホNo.1メディア by ラジオNIKKEI

石川温のスマホNo.1メディア

1 Listeners

楽しいラジオ「ドングリFM」 by donguri.fm

楽しいラジオ「ドングリFM」

6 Listeners

ごりゅごcast by goryugo & haruna1221

ごりゅごcast

0 Listeners

fukabori.fm by iwashi

fukabori.fm

4 Listeners

Off Topic // オフトピック by Off Topic

Off Topic // オフトピック

16 Listeners

歴史を面白く学ぶコテンラジオ (COTEN RADIO) by COTEN inc.

歴史を面白く学ぶコテンラジオ (COTEN RADIO)

215 Listeners

ガジェタッチ by リンクマン/弓月ひろみ

ガジェタッチ

3 Listeners

ひまじんプログラマーの週末エンジニアリングレッスン by ひまじんプログラマー

ひまじんプログラマーの週末エンジニアリングレッスン

0 Listeners

ゆるコンピュータ科学ラジオ by ゆるコンピュータ科学ラジオ

ゆるコンピュータ科学ラジオ

13 Listeners

Podcast by Yuka Studio // ユカスタポッドキャスト by Podcast by Yuka Studio

Podcast by Yuka Studio // ユカスタポッドキャスト

3 Listeners

耳で学ぶAI、ロボシンク by 矢野 哲平

耳で学ぶAI、ロボシンク

1 Listeners

ナレッジスタック Podcast by goryugo

ナレッジスタック Podcast

0 Listeners