画像生成AIで使えるプロンプトの考え方

画像生成AIでは、見た目の要素を言語でどう整理するかが重要です。 文章生成AIとは異なり、「何をどう見せるか」という視覚的な情報を テキストで的確に伝える必要があります。 最初は難しく感じますが、いくつかの要素を意識するだけで、 イメージに近い画像が生成されやすくなります。

画像生成AIの主要ツールと特徴

現在よく使われる画像生成AIには以下のものがあります。それぞれ得意な画風や プロンプトの書き方が異なります。

  • Midjourney:芸術的・映画的な画風が得意。英語のプロンプトを推奨。スタイル指定が豊富に機能する。
  • Stable Diffusion:カスタマイズ性が高い。ネガティブプロンプト(除外したい要素)が使えるのが特徴。
  • DALL-E 3(ChatGPT経由):自然な日本語の指示でもある程度動作する。リアル・イラスト両方に対応。
  • Adobe Firefly:商用利用しやすいライセンスが特徴。Adobe製品との連携が便利。
  • Imagen / Gemini:Googleの画像生成AI。シンプルな指示でもクオリティが高い。

プロンプトを構成する8つの要素

どのツールを使う場合でも、以下の要素を整理することでプロンプトが組み立てやすくなります。 すべての要素を使う必要はなく、表現したいポイントに絞って使うのが効果的です。

  • 被写体:何を(誰を)主役にするか。「白猫」「20代の女性」「桜の木」など
  • 背景:背景の場所・環境。「カフェの窓際」「夕焼けの海岸」「白いスタジオ背景」など
  • 構図:どんな角度・画角で見せるか。「バストアップ」「俯瞰」「広角」「クローズアップ」など
  • 光:光の向きや質感。「サイドライト」「バックライト」「柔らかい自然光」「ゴールデンアワー」など
  • 色:全体的な色のトーン。「パステルカラー」「モノクロ」「暖色系」「青みがかった冷たい色調」など
  • スタイル・雰囲気:画風や質感。「35mmフィルム風」「水彩画」「ミニマル」「サイバーパンク」など
  • 時代感:時代や季節。「現代」「昭和レトロ」「夏」「早春の朝」など
  • 質感・素材感:「ざらっとしたグレイン感」「ガラスのような透明感」「マットな質感」など

プロンプトの具体例

ポートレート写真風

「20代の日本人女性、カフェの窓際、自然光、柔らかいボケ感、35mmフィルム風、 アースカラーのコーディネート、バストアップ、穏やかな表情」

風景・情景

「京都の路地裏、石畳、初夏の朝、木漏れ日、緑と光のコントラスト、 広角レンズ、奥行きのある構図、静寂感、フィルムグレイン」

商品・オブジェクト

「ガラスの香水瓶、白い大理石のテーブルの上、トップライト、 透明感のある光の屈折、最小限の背景、プロダクト写真、高解像度」

優先順位の付け方

一度に全部の要素を詰め込むと不安定になることもあります。 まず「主役(被写体)」を明確にし、その後で雰囲気・光・スタイルを 補足として追加する方法が安定しやすいです。

また、プロンプトの前半に書いた要素ほど優先されやすい傾向があります。 最も大切にしたい要素を先頭に持ってくると、意図が伝わりやすくなります。

ネガティブプロンプトを使いこなす

Stable DiffusionなどではNegative Prompt(除外したい要素)を指定できます。 生成画像でよく起きる問題を除外するための定番キーワードがあります。

  • 「blurry, low quality, distorted, ugly」:低品質・歪みを防ぐ
  • 「extra fingers, extra limbs」:指の数おかしくなるのを防ぐ
  • 「watermark, text」:透かし・テキストを除外する
  • 「overexposed, underexposed」:露出の問題を防ぐ

ネガティブプロンプトを活用することで、不要な要素が入り込みにくくなり、 再生成の回数を減らすことができます。

試行錯誤を前提にする

画像生成は1回で完璧な結果を目指すよりも、 少しずつ要素を追加・修正しながら目的の画像に近づけるのが現実的です。 同じプロンプトでも生成のたびに結果が変わるため、 複数回生成して気に入ったものを選ぶことも有効な方法です。