ClaudeOpenAI NewsApr 10, 2026, 12:00 AM

Creating images with ChatGPT

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

claudeenmodel: claude-sonnet-4-20250514

ChatGPT Image Generation Guide - Best Practices for Engineers

Key Points

  • Generate production-ready images from 1-3 sentence prompts
  • Iterate quickly with targeted revisions and multi-image references
  • Handle text, infographics, and complex layouts with specific instructions

Summary

ChatGPT can now generate original images from text prompts, enabling rapid iteration and production-ready asset creation. This guide covers practical techniques for writing effective prompts, refining outputs, and handling advanced use cases.

Key Points

  • Effective prompts: Use 1-3 clear sentences focusing on purpose, subject, action, location, and visual style
  • Iterative refinement: Make small, targeted revisions one element at a time rather than broad changes
  • Text handling: Use quotes/ALL CAPS, specify font details, and spell out brand names letter-by-letter
  • Multiple images: Upload reference images with clear spatial descriptions (left, right, foreground, background)
  • Constraints: Explicitly state what should remain unchanged when editing existing images
  • Best practices: Prioritize clarity over clever phrasing, use specific lighting/material descriptions

Advanced Features

  • Support for infographics, timelines, and labeled diagrams
  • Multi-image uploads for style transfer and composition guidance
  • Targeted area editing with specific instructions
  • Production-ready output suitable for various formats and channels

Full Translation

Translations

A translation section that keeps the flow of the original article.

claudejamodel: claude-haiku-4-5

ChatGPTで画像を生成する

明確で説明的なプロンプトを使用して、画像を生成および改善します。

概要

ChatGPTは、平易な言語のプロンプトから独創的な画像を生成できます。迅速に反復処理でき、バリエーションをリクエストしたり、構成やサイズを調整したり、新しいビジュアル方向を探索したりして、本番環境対応のアセットを数分で作成できます。これにより、コンセプトの探索、アイデアの視覚的なコミュニケーション、異なるオーディエンス、フォーマット、またはチャネル向けの既存アセットの適応がより簡単になります。

効果的な画像プロンプトの作成

優れた画像プロンプトは長くある必要はありません。ほとんどの場合、1~3つの明確な文で十分です。目標は、ChatGPTが画像が何であるか、どのように感じるべきか、何を達成する必要があるかを理解するのを支援することです。

実際には、これはプロンプトを以下のいくつかの重要な詳細に基づいて作成することを意味します:

  • 画像の目的
  • メインの被写体
  • 何が起こっているか
  • どこで起こっているか
  • 望ましいビジュアルスタイル

フレーミング、照明、または特定の制約が重要な場合は、それらも含めてください。

明確さの重要性

明確さは巧妙な表現よりも効果的です。特にレイアウト、テクスチャ、素材、光などの詳細については顕著です。例えば、「左の窓からの柔らかい自然光」は通常、「美しい照明」のような曖昧な表現よりも信頼性が高くなります。

制約の使用

制約は、何かを固定したままにする必要がある場合に特に有用です。余分なテキスト、ロゴ、またはビジュアル変更が不要な場合は、それを直接述べてください。既存の画像を編集する場合は、何が変わるべきか、何が同じままであるべきかについて明確にしてください。「Xのみを変更します。他のすべてはまったく同じに保ってください」というプロンプトは、多くの場合、正確な編集をガイドする最も明確な方法です。

試してみる

デスクで新しいAIスキルを学んでいる人の、シンプルだが洗練された編集イラストを作成します。ラップトップ、ノートブック、本、付箋、および完了したチェックボックス、ハイライトされたセクション、または近くに固定された整理されたプランなどの進捗の微妙なマーカーを含めます。その人は集中して従事しているように見えるべきで、全体的なシーンは落ち着いた、生産的で、現実的に感じるべきです。クリーンで最小限の背景と、親しみやすく中立的に感じるモダンなデジタルイラストスタイルを使用します。ロゴとブランド参照、およびSFイメージリーまたは過度に抽象的なものは避けてください。

結果を改善するためのベストプラクティス

画像を改善する最良の方法は、通常、小さく的を絞った修正を通じてです。まずコアアイデアを正しく取得し、次に一度に1つの要素を調整します。直接的で具体的なフィードバックは広い反応よりも従いやすく、最も重要な詳細を繰り返すことは、画像を改善する際にドリフトするのを防ぐのに役立ちます。

有用でアクション可能な調整の例

  • 「より明るくする」
  • 「色を落ち着かせる」
  • 「背景を簡素化する」
  • 「同じ構成を保ちながら、スタイルをより現代的に/より柔らかく/より遊び心のあるものにする」

段階的な修正は、画像を改善する際に一貫性を維持するのに役立ちます。特定の領域を編集して、的を絞った指示を提供することもできます。

高度なガイダンス

複数のアップロード画像の使用

複数の画像をアップロードして生成または編集をガイドできますが、小さなセットは通常、大きなセットよりも管理しやすいです。各画像を順序で参照し、それらがどのように関連しているかを説明します。

例:「画像1は私のデスクセットアップの写真です。画像2はスタイルリファレンスです。画像2のクリーンで最小限のイラストスタイルを画像1に適用しながら、同じレイアウトとオブジェクトを保ちます。」

要素を組み合わせるときは、左、右、前景、背景などの明確な空間言語を使用して関係を説明します。

画像内のテキスト(タイトル、ラベル、見出し)

テキストは、指示が非常に具体的な場合に最適に機能します:

  • テキストを引用符またはALL CAPSで配置する
  • フォントスタイル、サイズ、色、配置を指定する
  • テキストを短くする
  • ブランド名/一般的でない単語の場合は、文字ごとにスペルアウトする(例:「S-T-R-I-P-E」)

例:「見出し「WEEKLY PLAN」をボールドサンセリフ、白、上部中央、72ptで追加します。他のテキストはありません。」

インフォグラフィックスと密集したレイアウト

インフォグラフィックスは、説明者、ポスター、ラベル付き図、タイムライン、および「ビジュアルwiki」アセットに役立ちます。密集したレイアウトまたは画像内の大量のテキストの場合は、「シャープなテキストレンダリング」を強調し、必要に応じてデザインツールで磨くことを検討してください。

追加の考慮事項

肖像権への配慮

実在の人物(自分自身または他の人を含む)の画像を生成する場合は、正確性のためにリファレンス写真を使用し、その肖像を使用する許可があることを確認してください。

一般的対特定

疑わしい場合は、特定のブランド、製品、またはアートワークを模倣するのではなく、デザインの「一般的な」または「所有可能な」バージョンをリクエストしてください。

帰属は任意

生成された画像を使用する場合、OpenAIにクレジットを付与する必要はありませんが、アセットがどのように作成されたかを明確にするのに役立つ場合は、そうすることができます。

ポリシー準拠

すべての画像の使用は、組織のガイドラインとOpenAIの使用ポリシーに従う必要があります。

OpenAI Academyで学習を続ける

実践的なAIスキルを構築するのに役立つ追加のガイドとリソースを発見してください。

関連トピック

  • ChatGPTでプロジェクトを使用する - OpenAI Academy - 2026年4月10日
  • カスタムGPTsを使用する - OpenAI Academy - 2026年4月10日
  • スキルを使用する - OpenAI Academy - 2026年4月10日