【Midjourney】話題のAIによる画像生成を体験しよう！スマホからも利用可能！

2022年8月4日2022年9月13日

テキストから画像生成できる「Midjourney」が登場しました。

このtext to imageの技術の進歩は著しいものがありますね。

個人的に今後が楽しみな分野でもあります。

また、これまでにテキストから画像生成できるAIとして「Dream by WOMBO」や「DALL-E mini」などが公開されています。

新たに画像生成AIが登場しました。こちらも面白いので是非ご覧ください。

では、「Midjourney」の使い方や実際に試してみた画像を見ていきます。

使い方

画像を生成させるためには、Discodeを使う必要があります。

順を追って説明します。

Midjourneyのサイトへ

まずは、「Midjourney」をクリックしてください。

クリックすると、次のようなページに飛びます。

少しびっくりしますね。

Discodeサーバに入る

次に「join the beta」をクリックしてDiscodeサーバに入ります。

Discodeのアカウントを持っていない方は作成する必要があります。

招待リンク切れになった方はこちら

招待リンク切れちゃったんだけど？という方（私です）

どうすればいいのか分からなかったので、いろいろ試行錯誤していました。

他のブラウザからリンクに飛んだり、他の端末からリンクに飛んだり、招待URLを「サーバに参加」から直接入力したりしました。

結果はどれも意味がありませんでした。

もう無理だと思ったので、大人しく新しいアカウントを作りました。

そのアカウントで同じようにすると解決しました。

新しいアカウントを作ろう

上手くいった場合の左側はこんな感じになります。

チャンネルに入る

続いて、「newbies-〇〇」チャンネルに入ります。

この〇〇の部分は割り振られるものらしいので、人によって異なる数字が入ります。

コマンドを入力する

チャンネルに入ると、次のようなメッセージを入力できるフォームがあると思います。

このフォームに「/imagine」と入力してください。

入力の途中で一致するコマンドの中に「/imagine」が出てくると思うので選択してください。

生成したい画像の説明文を入力する

選択すると、次のようになります。

このpromptの続きに生成したい画像の説明文を英語で入力します。

英語が苦手な方は、「DeepL」をお使いください。

テキストを入力して数十秒待つと、４枚の画像が生成されます。

画像を操作する

生成した画像は、スケールアップしたり傾向が似ている画像を新しく生成したりできます。

詳しくは、こちらをご覧ください。

ちなみにこれらの操作も無料クレジット枠を消費するので注意が必要です。

少し検証してみた

テキストについて少し検証してみます。

日本語を入力する

英語で入力するべきですが、日本語で入力するとどうなるのか気になったので試してみます。

海の上を走るペガサス

左上の女性を除いた他の画像は、海は描けていますがペガサスは見当たりませんね。

日本語では無理そうです。

日本語で学習したモデルが登場しました。

ちなみに英語で同じ内容のテキストを渡した時の画像はこちらです。

Pegasus running on the sea（海の上を走るペガサス）

ペガサスらしき生き物が海の上を走っていますね。

画質が良くなるテキスト

他の方が生成している画像を見ていると、high quailtyや8kなど画像のクオリティを上げるためのテキストをコンマ区切りで与えているものが散見されました。

これらの影響はあるのか少しだけ検証してみます。

まずは、生成したい画像の説明文だけ与えてみます。

ancient woodland, bluebells, sunlit path, silver stag（古代林、ブルーベル、陽のあたる道、銀色の雄）

これだけでも美しいですね。

では、画質の向上しそうなテキストをプラスしてみます。

ancient woodland, bluebells, sunlit path, silver stag, render 8k, 4320p, hd, 8k HQ, ultra high quality（古代林、ブルーベル、陽のあたる道、銀色の雄鹿、レンダー8k、4320p、HD、8k HQ、超高画質）

少し写真ぽくなってそうですね。

少なくとも影響はあると言えると思います。

画像を生成してみた

では、いろいろと生成してみたので、どのような画像を生成できるのかを見ていきましょう。

スチームパンク風の画像

Decades-old steampunk factory converted to futuristic cyberpunk-themed luxury hotel, ultra high quality, perfectly shaped（数十年前に建てられたスチームパンクの工場を、サイバーパンクをテーマにした未来的な高級ホテルに改装、超高品質で完璧な形状を実現）

キレイですね。

超集合体モンスターの画像

surreal painting overpopulated hyperdetailed monster, 8k HQ, talented artist（シュールな絵の超過密で詳細なモンスター、8k HQ、才能あるアーティスト）

出会いたくないですね。

物語が始まりそうな画像

Little girls in enchanted forest beside a old castle with purple dragon in the dark blue sky, 8k, ultra high quality（紺碧の空に紫の竜と古い城の横の魔法の森の少女、8K、超高画質）

ドラゴンは見当たりませんが、空と同化しているのかもしれませんね。

短いテキストで生成した画像

ark of the covenant, 8k, hd（聖書の箱、8K、HD）

開けると何か起こりそうな箱ですね。

特殊なハンバーガーの画像

mechanic hamburger（機械仕掛けのハンバーガー）

見た目はハンバーガーですが、食べると鉄の味がするのでしょうか？

まとめ

生成した画像を見る限りではかなり面白いAIですね。

ただテキストを与えるだけではなく参考となる画像を渡したり、パラメータを調整することもできるみたいなのでまだまだ底が見えませんね。

これからは、どんなテキストを与えるかが試されることになるかもしれません。

ぜひ試してみてください！

この記事が気に入ったら
フォローしてね！

Follow @note_zan_

よかったらシェアしてね！

URLをコピーしました！

マルチモーダルAIを学ぶ上で読んでほしい書籍『深層学習からマルチモーダル情報処理へ』

「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理人工知能プログラミング実践入門」を読んで

「Python実践100本ノックシリーズ」を読んで｜どんな人におすすめなのか

【Midjourney】話題のAIによる画像生成を体験しよう！スマホからも利用可能！