OpenAIは2025年3月、ChatGPTにネイティブの画像生成機能を実装した。
従来のDALL-E 3に代わり、GPT-4oに組み込まれた新しい画像生成エンジンがデフォルトとなり、テキスト描画の精度やプロンプトへの忠実さが大幅に向上している。
GPT-4o画像生成の特徴
新しい画像生成機能は、OpenAIが「これまでで最も先進的な画像生成器」と位置づけるものだ。
DALL-E 3と何が違うんですか?
大きな違いは3つあります。テキストを正確に描画できること、プロンプトに忠実であること、そしてGPT-4oの知識ベースやチャット文脈を活用できることです。
GPT-4o画像生成の主な特徴は以下の通りだ。
- テキストの正確な描画(看板、ロゴ、文字入りイラストなど)
- プロンプトへの高い忠実性
- GPT-4oの知識ベースを活用した文脈理解
- アップロード画像の変換・編集に対応
- 背景透過処理に対応
DALL-E 3はレガシーモデルに
2025年3月、DALL-E 3はChatGPTのGPT Image機能に置き換えられた。
DALL-E 3は「レガシーモデル」として引き続き利用可能だが、OpenAIはDALL-Eアーキテクチャの限界に達したと判断し、今後の開発はGPT-4oベースの画像生成に集中する方針だ。
DALL-E 3を使いたいユーザーは、専用の「DALL-E GPT」から引き続きアクセスできる。
利用可能なユーザー
GPT-4o画像生成は、以下のユーザーに展開されている。
| プラン | 利用可否 |
|---|---|
| Plus | ○ |
| Pro | ○ |
| Team | ○ |
| Free | ○ |
| Enterprise | 順次対応 |
| Edu | 順次対応 |
使い方は簡単
画像生成の方法は2つある。
- 「画像を作って」と指示するだけ
- マイクアイコン横の「すべてのツールを表示」から「画像を作成」を選択
特別な操作は必要ないんですね!
はい、自然言語で指示するだけです。複雑な指示の場合は生成に最大2分かかることもありますが、基本的には数秒で完了します。
投資家にとっての意味
画像生成AI市場は急成長しており、OpenAIはこの分野でもリーダーシップを維持している。
- OpenAIの競争力が一段と強化
- クリエイティブ産業でのAI活用が加速
- 広告・マーケティング分野での需要拡大
- 著作権・倫理問題が依然として課題
- 競合他社(Midjourney、Adobe Firefly等)も進化中
- 無料ユーザーへの機能開放で収益化に影響?
OpenAIは非上場企業だが、Microsoftが主要投資家として出資している。画像生成AI市場の成長は、Microsoft(MSFT)をはじめとするAI関連銘柄に間接的な恩恵をもたらす可能性がある。
まとめ
- ChatGPTにGPT-4oネイティブの画像生成機能が実装
- DALL-E 3を上回るテキスト描画精度とプロンプト忠実性
- 2025年3月から全ユーザー(Plus、Pro、Team、Free)に展開
- DALL-E 3はレガシーモデルとして継続利用可能
- 画像生成AI市場でOpenAIがリードを維持
よくある質問
テキストを正確に描画できること、プロンプトへの忠実さが高いこと、GPT-4oの知識ベースやチャット文脈を活用できることが主な違いです。アップロード画像の編集や背景透過にも対応しています。
はい、2025年3月の時点でPlus、Pro、Team、Freeすべてのユーザーに展開されています。Enterprise、Eduには順次対応予定です。
OpenAIは非上場ですが、主要投資家のMicrosoft(MSFT)や、AI関連ETF(AIQ、BOTZ等)を通じて間接的に投資することが可能です。ただし、AI市場は競争が激しく、リスクも大きい点に注意してください。
※本記事は情報提供を目的としており、特定の金融商品の購入を推奨するものではありません。
投資に関する最終決定は、ご自身の判断と責任において行ってください。