2024年8月に、Web版Midjourneyがリリースされました。チャットアプリ「Discord」を経由しなくてもよくなったため、初心者のかたでも画像生成AIを使いやすくなりました。
Midjourneyでは、「プロンプト」(=描いてほしい画像の内容を、AIに伝える指示書)を用いて画像を生成します。
この記事では、Web版Midjourneyを始めたばかりのかたに向け、プロンプトの基本的な書き方とコツをお伝えします。
【Web版Midjourney】初心者向けプロンプトの基本
❶ 基本的なプロンプト
Midjourneyでは、かんたんな英単語やフレーズ、絵文字だけでも画像を生成できます。
プロンプト:Japanese Temple
プロンプト:😂
❷ パラメーターで画像の設定を変える
Modjourneyでは文末にパラメーター(変数)を指定することで、画像に細かい設定を与えます。
たとえば、アスペクト比。
デフォルトでは画像の縦横比は、「1:1」。プロンプトの最後に「–aspect〇:〇」や「–ar〇:〇」と指定することで、縦横比を変えることができます。
プロンプト:running racehorses –ar7:4
たとえば、カオス(混乱)。
「–chaos」または「–c」を入力することで、結果にバリエーションを付けます。カオスの値は「0~100」のあいだで設定でき、数値が大きいほどバリエーションの変化も大きくなります。
プロンプト:giant meerkat –c 20
※ なお、Web版のMidjourneyは、プロンプト入力画面の右側の「設定アイコン」から、アスペクト比やカオス、Midjourneyのバージョンなどを指定できます。
わざわざ文末にパラメーターを付けなくても、細かい設定が可能になりました(※ 以下の画像は、アスペクト比16:9で固定しています)。
❸ 英単語やフレーズをカンマで「,」で区切って、組み合わせる
Midjourneyでは長文のプロンプトを打つより、英単語や短いフレーズを組み合わせたほうが画像の精度が高くなります。
プロンプト:japanese beautiful woman,wearing kimono,taken at a photo studio,at October
◆ 日本語訳:日本の美しい女性,着物を着た,写真館で撮った,10月に
【2024年8月】初心者向けプロンプトの書き方&翻訳AIの使い方
Web版Midjourneyの公式サイトで、左側のメニューより「Explore」➤「気になった画像」をクリックすると、その画像を作ったクリエーターのプロンプトを見ることができます。
プロンプトは人によってバラバラ。2~3の英単語をカンマで区切る人もいれば、小説の一節のような文章を組み合わせる人もいます。
インターネットで「Midjourney プロンプト 書き方」でググると、2023年ごろに書かれた記事が見つかります。
しかし、Web版Midjourneyは、よりシンプルなプロンプトで画像生成できます。Midjourney自体も何度かバージョンアップしていますので、そこまでルールに縛られなくてもよいです。
あくまで目安として、多くのクリエーターが採用していた構成をご紹介します。
【2024年8月】多くのクリエーターが使っているプロンプト【構成の順番】
❶ 画風・作風(アートや写真の形式)
❷ 主題、主題の補足(環境やキャラクターの状態、感情)
❸ 構図
❹ 照明や画質
(❺ )パラメーター(アスペクト比や変化の幅など)
※ 必ずしもこの順番でなくても生成できますが、❺パラメーターだけはいちばん最後に書きます。なお、Web版は設定からパラメーターをいじれるので、❺はなくてもOKです。
◆ プロンプトの例
1910s activity photo, Yeti over 2m in height lying on Himalayan mountainside, two Eskimos looking down on Yeti from high up, aerial view, oblique angle, 4k
(日本語訳:1910年代の活動写真,ヒマラヤ山脈の中腹に体調2mを越えるイエティが横たわっている,2人のエスキモーが高所からイエティを見下ろしている,空撮,斜めのアングル,4k)
◆ 生成された画像
【Web版Midjourney】プロンプトのコツと、翻訳AIの使い方
特に気をつけたいのは、2.英単語は正確にと、5.複数形は具体的な数を記述する、です
◆ イメージした日本語を英語に変換:おすすめのツールは「DeepL翻訳」
Midjourneyのプロンプトは英語で入力します。
頭に描いた日本語のイメージを英語に変換するツールとしては、「Google翻訳」や「Chatgpt」が挙げられます。筆者がおすすめするのが、高精度の翻訳AI「DeepL翻訳」です。
無料で使えますし、〈日本語 ⇆ 英語〉の切り替えが瞬時にできるので便利です。
◆ DeepL翻訳で、日本語で単語や文節をカンマで区切ってつなげて入力 ➤ AIが瞬時に英語に翻訳 ➤ 出力されたテキストをコピペして、Mijourneyのプロンプト入力欄に貼り付ける
イメージと違った?筆者のプロンプト失敗例を紹介
Midjourneyを使っていると、高画質だけど何かが違う・・・ということがよく起きます。
◆ 筆者が失敗したプロンプトの例
プロンプト:Commemorative photo of three college girls,wearing a square hat,happy smiles, realistic skin texture, taken around noon, June, blue sky, composition peeking out from below,4k
(日本語訳:女子大生3人の卒業写真,四角い帽子を被っている,幸せな笑顔,リアルな肌質,お昼ごろ,6月,青い空,下から見上げる構図,4K画質)
英単語が具体性を欠いてしまった、失敗例です。本当は、アメリカの大学生が卒業式に投げる帽子をイメージしたんですが・・・
プロンプトの「wearing a square hat」(=四角い帽子を被って)が抽象的だったためと、「June」(=6月)と入力したために、AIが“麦わら帽子”を出力したようです。
◆ 改善したプロンプト
Commemorative photo of three college girls,Wearing a mortarboard,happy smiles, realistic skin texture, taken around dusk, blue sky, composition peeking out from below,4k
(日本語訳:女子大生3人の卒業写真,mortarboardを被っている,幸せな笑顔,リアルな肌質,お昼ごろ,青い空,下から見上げる構図,4K画質)
卒業式で投げる帽子が「mortarboard」だと調べて入力。「6月」の記述もあえて削除してみます。帽子や光の差し込みかたは、イメージした通りになりました
【Web版Midjourney】プロンプト 構成の順番と、よく使われる英単語
❶ 画風・作風(アートや写真の形式)
❷ 主題、主題の補足(環境やキャラクターの状態、感情)
❸ 構図
❹ 照明や画質
(❺ )パラメーター(アスペクト比や変化の幅など)
❶ 画風・作風(アートや写真の形式)
絵のスタイル、写真の表現形式、被写体の材質、年代(時代設定など)です。
Pencil Sketch:鉛筆スケッチ
oil painting:油絵
pop art:ポップアート
watercolor painting:水彩画
Ukiyo-e:浮世絵
manga, monochrome:日本の白黒マンガ
snapshot:スナップ写真
Landscape photography:風景写真
Portrait photography:ポートレート写真(=人物像や感情を引き立たせる)
Street photography:ストリート写真(=街中を行き交う人々の、瞬間のドラマを捉える)
1700s:1700年代
1990s:1990年代
2000’s CG animation style:2000年代のCCアニメーション風に
❷ 主題、主題の補足(環境やキャラクターの状態、感情)
「主題」とは、キャラクターや動物、物体、場所などを指します。「主題の補足」とは、人物や物体の状態(走っているのか座っているのか)や感情を指します。
Adult male:大人の男性
Little girl:小さい女の子
14 years old:14歳
husband and wife:夫婦
flock of birds:鳥の群れ
blue sky:青空
Sky full of stars:空いっぱいの星
group of buildings:ビル群
a field of flowers:一面の花畑
❸ 構図
カメラの角度や画角を指示するプロンプトです。
long shot:遠景
close up:至近距離
bird’s-eye view:鳥瞰図(ちょうかんず=上空から見下ろしたような構図)
Side view:横から
High angle:高い位置から見下ろす角度
Low angle:低い位置から見上げる角度
bust shot:人物の胸から上を撮影する技法
Selfie shot:自撮り
POV shot:主観視点
❹ 照明(ライティング)や画質
照明や色味は、画像の印象を大きく変えます。
natural light:自然光
Reflector:反射板(レフ版=逆行を人物にあて、表情を明るくする)
Neon lighting:ネオン照明
morning light:朝日
First lightまたはdawn:夜明け
sunset:夕陽
FHD(またはFull HD):フルHD
4K:4K画質
8K:8K画質
highres:高解像度
作品例とプロンプト
今後も、Web版Midjourneyの使い方やプロンプトをご紹介してゆきます。初めてクレヨンを触った子どもの頃にように、画像生成AIを楽しんでいただけたら嬉しいです。