2024年8月に、Web版Midjourneyがリリースされました。チャットアプリ「Discord」を経由しなくてもよくなったため、初心者のかたでも画像生成AIを使いやすくなりました。

Midjourneyでは、「プロンプト」(=描いてほしい画像の内容を、AIに伝える指示書)を用いて画像を生成します。

この記事では、Web版Midjourneyを始めたばかりのかたに向け、プロンプトの基本的な書き方とコツをお伝えします。

Midjourney、日本人女性、着物
Midjourneyで生成した画像
Midjourney、メルヘン

【Web版Midjourney】初心者向けプロンプトの基本

❶ 基本的なプロンプト

Midjourneyでは、かんたんな英単語やフレーズ、絵文字だけでも画像を生成できます。

プロンプト:Japanese Temple

日本のお寺、画像生成AI

プロンプト:😂

絵文字だけ、Midjourney

❷ パラメーターで画像の設定を変える

Modjourneyでは文末にパラメーター(変数)を指定することで、画像に細かい設定を与えます。

たとえば、アスペクト比

デフォルトでは画像の縦横比は、「1:1」。プロンプトの最後に「–aspect〇:〇」や「–ar〇:〇」と指定することで、縦横比を変えることができます。

プロンプト:running racehorses –ar7:4

競走馬、画像生成AI

たとえば、カオス(混乱)。

「–chaos」または「–c」を入力することで、結果にバリエーションを付けます。カオスの値は「0~100」のあいだで設定でき、数値が大きいほどバリエーションの変化も大きくなります。

プロンプト:giant meerkat –c 20

巨大なミーアキャット

※ なお、Web版のMidjourneyは、プロンプト入力画面の右側の「設定アイコン」から、アスペクト比やカオス、Midjourneyのバージョンなどを指定できます。

Web版、パラメーター、設定からも指定できる

わざわざ文末にパラメーターを付けなくても、細かい設定が可能になりました(※ 以下の画像は、アスペクト比16:9で固定しています)。

❸ 英単語やフレーズをカンマで「,」で区切って、組み合わせる

Midjourneyでは長文のプロンプトを打つより、英単語や短いフレーズを組み合わせたほうが画像の精度が高くなります

プロンプト:japanese beautiful woman,wearing kimono,taken at a photo studio,at October

◆ 日本語訳:日本の美しい女性,着物を着た,写真館で撮った,10月に

着物を着た日本人女性、ミッドジャーニー

【2024年8月】初心者向けプロンプトの書き方&翻訳AIの使い方

Web版Midjourneyの公式サイトで、左側のメニューより「Explore」➤「気になった画像」をクリックすると、その画像を作ったクリエーターのプロンプトを見ることができます。

explore、他のクリエーター
出典:https://www.midjourney.com/
クリエーターのプロンプト
出典:https://www.midjourney.com/

プロンプトは人によってバラバラ。2~3の英単語をカンマで区切る人もいれば、小説の一節のような文章を組み合わせる人もいます。

インターネットで「Midjourney プロンプト 書き方」でググると、2023年ごろに書かれた記事が見つかります。

しかし、Web版Midjourneyは、よりシンプルなプロンプトで画像生成できます。Midjourney自体も何度かバージョンアップしていますので、そこまでルールに縛られなくてもよいです。

あくまで目安として、多くのクリエーターが採用していた構成をご紹介します。

【2024年8月】多くのクリエーターが使っているプロンプト【構成の順番】

❶ 画風・作風(アートや写真の形式)

❷ 主題、主題の補足(環境やキャラクターの状態、感情)

❸ 構図

❹ 照明や画質

(❺ )パラメーター(アスペクト比や変化の幅など)

※ 必ずしもこの順番でなくても生成できますが、❺パラメーターだけはいちばん最後に書きます。なお、Web版は設定からパラメーターをいじれるので、❺はなくてもOKです。

◆ プロンプトの例

1910s activity photo, Yeti over 2m in height lying on Himalayan mountainside, two Eskimos looking down on Yeti from high up, aerial view, oblique angle, 4k

(日本語訳:1910年代の活動写真,ヒマラヤ山脈の中腹に体調2mを越えるイエティが横たわっている,2人のエスキモーが高所からイエティを見下ろしている,空撮,斜めのアングル,4k)

◆ 生成された画像

イエティが横たわっている、AIで生成した画像

【Web版Midjourney】プロンプトのコツと、翻訳AIの使い方

  1. 英単語、または短い文章をカンマ「,」で並べてゆく
  2. 英単語はなるべく具体的に
  3. 同義語でも微妙にニュアンスが違う(big,huge,gigantic,immenseはそれぞれ表現が変わる)
  4. 文頭の大文字・小文字の区別はないので、気にしない
  5. 複数形は具体的な数字を記述する(rabbit より three rabbits)
  6. 否定分は記述しない(No chicken on the table と入れると、チキンが含まれる可能性がある)
  7. すぐにイメージ通りの画像が作れないときは、同じプロンプトで何回も出力してみる(100枚作って、ようやくイメージ通りの画像ができることも)

特に気をつけたいのは、2.英単語は正確にと、5.複数形は具体的な数を記述する、です

◆ イメージした日本語を英語に変換:おすすめのツールは「DeepL翻訳」

Midjourneyのプロンプトは英語で入力します。

頭に描いた日本語のイメージを英語に変換するツールとしては、「Google翻訳」や「Chatgpt」が挙げられます。筆者がおすすめするのが、高精度の翻訳AI「DeepL翻訳」です。

無料で使えますし、〈日本語 ⇆ 英語〉の切り替えが瞬時にできるので便利です。

◆ DeepL翻訳で、日本語で単語や文節をカンマで区切ってつなげて入力 ➤ AIが瞬時に英語に翻訳 ➤ 出力されたテキストをコピペして、Mijourneyのプロンプト入力欄に貼り付ける

DeepL翻訳、英語に変換
出典:https://www.deepl.com/

イメージと違った?筆者のプロンプト失敗例を紹介

Midjourneyを使っていると、高画質だけど何かが違う・・・ということがよく起きます。

◆ 筆者が失敗したプロンプトの例

プロンプト:Commemorative photo of three college girls,wearing a square hat,happy smiles, realistic skin texture, taken around noon, June, blue sky, composition peeking out from below,4k

(日本語訳:女子大生3人の卒業写真,四角い帽子を被っている,幸せな笑顔,リアルな肌質,お昼ごろ,6月,青い空,下から見上げる構図,4K画質)

アメリカの女子大生、卒業写真

英単語が具体性を欠いてしまった、失敗例です。本当は、アメリカの大学生が卒業式に投げる帽子をイメージしたんですが・・・

プロンプトの「wearing a square hat」(=四角い帽子を被って)が抽象的だったためと、「June」(=6月)と入力したために、AIが“麦わら帽子”を出力したようです。

◆ 改善したプロンプト

Commemorative photo of three college girls,Wearing a mortarboard,happy smiles, realistic skin texture, taken around dusk, blue sky, composition peeking out from below,4k

(日本語訳:女子大生3人の卒業写真,mortarboardを被っている,幸せな笑顔,リアルな肌質,お昼ごろ,青い空,下から見上げる構図,4K画質)

卒業式に投げる帽子、mortarboard

卒業式で投げる帽子が「mortarboard」だと調べて入力。「6月」の記述もあえて削除してみます。帽子や光の差し込みかたは、イメージした通りになりました

【Web版Midjourney】プロンプト 構成の順番と、よく使われる英単語

❶ 画風・作風(アートや写真の形式)

❷ 主題、主題の補足(環境やキャラクターの状態、感情)

❸ 構図

❹ 照明や画質

(❺ )パラメーター(アスペクト比や変化の幅など)

❶ 画風・作風(アートや写真の形式)

絵のスタイル、写真の表現形式、被写体の材質、年代(時代設定など)です。

日本のマンガ風、ロボットに乗る少年、プロンプトの順番
プロンプト:manga, monochrome,A boy riding a robot

Pencil Sketch:鉛筆スケッチ

oil painting:油絵

pop art:ポップアート

watercolor painting:水彩画

Ukiyo-e:浮世絵

manga, monochrome:日本の白黒マンガ

snapshot:スナップ写真

Landscape photography:風景写真

Portrait photography:ポートレート写真(=人物像や感情を引き立たせる)

Street photography:ストリート写真(=街中を行き交う人々の、瞬間のドラマを捉える)

1700s:1700年代

1990s:1990年代

2000’s CG animation style:2000年代のCCアニメーション風に

❷ 主題、主題の補足(環境やキャラクターの状態、感情)

ポートレート写真、14歳の少年の屈折した表情
プロンプト:Portrait Photography, refracted expression of a 14 year old boy

「主題」とは、キャラクターや動物、物体、場所などを指します。「主題の補足」とは、人物や物体の状態(走っているのか座っているのか)や感情を指します。

Adult male:大人の男性

Little girl:小さい女の子

14 years old:14歳

husband and wife:夫婦

flock of birds:鳥の群れ

blue sky:青空

Sky full of stars:空いっぱいの星

group of buildings:ビル群

a field of flowers:一面の花畑

❸ 構図

父親を見上げる3歳の男の子、ローアングル
プロンプト:Three year old boy looking up at his father, low angle, low position

カメラの角度や画角を指示するプロンプトです。

long shot:遠景

close up:至近距離

bird’s-eye view:鳥瞰図(ちょうかんず=上空から見下ろしたような構図)

Side view:横から

High angle:高い位置から見下ろす角度

Low angle:低い位置から見上げる角度

bust shot:人物の胸から上を撮影する技法

Selfie shot:自撮り

POV shot:主観視点

❹ 照明(ライティング)や画質

日本の夜明けぜよ。プロンプトの順番
プロンプト:Ryoma Sakamoto, sword at his waist, looking diagonally ahead, stagnant sky, side angle,first light

照明や色味は、画像の印象を大きく変えます。

natural light:自然光

Reflector:反射板(レフ版=逆行を人物にあて、表情を明るくする)

Neon lighting:ネオン照明

morning light:朝日

First lightまたはdawn:夜明け

sunset:夕陽

FHD(またはFull HD):フルHD

4K:4K画質

8K:8K画質

highres:高解像度

作品例とプロンプト

プロンプト:Short-cut Korean woman, 22 years old, with melancholy in her beauty,POV shot
坂本龍馬と習字
プロンプト:Sakamoto Ryoma, sword pointed at waist, looking into distance, Kanji characters written in rough touch in ink on background wall, oblique angle from behind, dawn –no signature –niji 6 –ar 16:9
女の子とカエル
プロンプト:Looking down, miniature made of clay work, dwarfed girl on a frog, just stopped raining, high quality

今後も、Web版Midjourneyの使い方やプロンプトをご紹介してゆきます。初めてクレヨンを触った子どもの頃にように、画像生成AIを楽しんでいただけたら嬉しいです。