Llama-2が登場!8bit+LoRAでRLHFファインチューニングを試す方法はこちら

【Midjourney】話題のAIによる画像生成を体験しよう!スマホからも利用可能!

テキストから画像生成できる「Midjourney」が登場しました。

このtext to imageの技術の進歩は著しいものがありますね。

個人的に今後が楽しみな分野でもあります。

また、これまでにテキストから画像生成できるAIとして「Dream by WOMBO」や「DALL-E mini」などが公開されています。

あわせて読みたい
【Dream by WOMBO】twitterで話題の画像生成アプリの使い方を解説!言葉から画像ができちゃう!? 今回紹介するのはtwitterで話題となっている画像生成アプリDream by WOMBOです。 これまでも画像生成のアプリは出てきましたが、今回紹介するアプリはなんとキーワードを指定するとそれに沿った画像を生成してくれます。こちらのアプリはApp Store、Google play、またはウェブ上で利用できます。
あわせて読みたい
【DALL-E mini】AIによるテキスト→画像生成を実際に試してみた!スマホでも生成できる! DALL-E miniとは、テキストから画像を生成するモデルであるDALL-Eの小型版です。小さいとはいうものの面白い画像が生成できます。今回は、そんなDALL-E miniの使い方の解説と実際に生成した画像を紹介します。

新たに画像生成AIが登場しました。こちらも面白いので是非ご覧ください。

あわせて読みたい
【Stable Diffusion】Dream Studioを試そう!スマホからも利用可能!画像生成サービスを紹介! テキストから画像を生成するサービス「Dream Studio」はスマホからも利用できます。今回は、Google Colablatoryで実行する方法なども合わせて利用する方法を解説します。

では、「Midjourney」の使い方や実際に試してみた画像を見ていきます。

目次

使い方

画像を生成させるためには、Discodeを使う必要があります。

順を追って説明します。

Midjourneyのサイトへ

まずは、「Midjourney」をクリックしてください。

クリックすると、次のようなページに飛びます。

少しびっくりしますね。

Discodeサーバに入る

次に「join the beta」をクリックしてDiscodeサーバに入ります。

Discodeのアカウントを持っていない方は作成する必要があります。

上手くいった場合の左側はこんな感じになります。

チャンネルに入る

続いて、「newbies-〇〇」チャンネルに入ります。

この〇〇の部分は割り振られるものらしいので、人によって異なる数字が入ります。

コマンドを入力する

チャンネルに入ると、次のようなメッセージを入力できるフォームがあると思います。

このフォームに「/imagine」と入力してください。

入力の途中で一致するコマンドの中に「/imagine」が出てくると思うので選択してください。

生成したい画像の説明文を入力する

選択すると、次のようになります。

このpromptの続きに生成したい画像の説明文を英語で入力します。

英語が苦手な方は、「DeepL」をお使いください。

テキストを入力して数十秒待つと、4枚の画像が生成されます。

画像を操作する

生成した画像は、スケールアップしたり傾向が似ている画像を新しく生成したりできます。

詳しくは、こちらをご覧ください。

ちなみにこれらの操作も無料クレジット枠を消費するので注意が必要です。

少し検証してみた

テキストについて少し検証してみます。

日本語を入力する

英語で入力するべきですが、日本語で入力するとどうなるのか気になったので試してみます。

海の上を走るペガサス

左上の女性を除いた他の画像は、海は描けていますがペガサスは見当たりませんね。

日本語では無理そうです。

日本語で学習したモデルが登場しました。

あわせて読みたい
日本語テキストに特化した画像生成モデルJapanese Stable Diffusionをcolabで試してみた! 近年、テキストから画像を生成する技術が盛り上がりを見せています。 最近では、「Midjourney」や「Dream Studio」などがSNSで話題となっていますが、日本語のテキスト...

ちなみに英語で同じ内容のテキストを渡した時の画像はこちらです。

Pegasus running on the sea(海の上を走るペガサス)

ペガサスらしき生き物が海の上を走っていますね。

画質が良くなるテキスト

他の方が生成している画像を見ていると、high quailtyや8kなど画像のクオリティを上げるためのテキストをコンマ区切りで与えているものが散見されました。

これらの影響はあるのか少しだけ検証してみます。

まずは、生成したい画像の説明文だけ与えてみます。

ancient woodland, bluebells, sunlit path, silver stag(古代林、ブルーベル、陽のあたる道、銀色の雄)

これだけでも美しいですね。

では、画質の向上しそうなテキストをプラスしてみます。

ancient woodland, bluebells, sunlit path, silver stag, render 8k, 4320p, hd, 8k HQ, ultra high quality(古代林、ブルーベル、陽のあたる道、銀色の雄鹿、レンダー8k、4320p、HD、8k HQ、超高画質)

少し写真ぽくなってそうですね。

少なくとも影響はあると言えると思います。

画像を生成してみた

では、いろいろと生成してみたので、どのような画像を生成できるのかを見ていきましょう。

スチームパンク風の画像

Decades-old steampunk factory converted to futuristic cyberpunk-themed luxury hotel, ultra high quality, perfectly shaped(数十年前に建てられたスチームパンクの工場を、サイバーパンクをテーマにした未来的な高級ホテルに改装、超高品質で完璧な形状を実現)

キレイですね。

超集合体モンスターの画像

surreal painting overpopulated hyperdetailed monster, 8k HQ, talented artist(シュールな絵の超過密で詳細なモンスター、8k HQ、才能あるアーティスト)

出会いたくないですね。

物語が始まりそうな画像

Little girls in enchanted forest beside a old castle with purple dragon in the dark blue sky, 8k, ultra high quality(紺碧の空に紫の竜と古い城の横の魔法の森の少女、8K、超高画質)

ドラゴンは見当たりませんが、空と同化しているのかもしれませんね。

短いテキストで生成した画像

ark of the covenant, 8k, hd(聖書の箱、8K、HD)

開けると何か起こりそうな箱ですね。

特殊なハンバーガーの画像

mechanic hamburger(機械仕掛けのハンバーガー)

見た目はハンバーガーですが、食べると鉄の味がするのでしょうか?

まとめ

生成した画像を見る限りではかなり面白いAIですね。

ただテキストを与えるだけではなく参考となる画像を渡したり、パラメータを調整することもできるみたいなのでまだまだ底が見えませんね。

これからは、どんなテキストを与えるかが試されることになるかもしれません。

ぜひ試してみてください!

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

目次