Llama-2が登場!8bit+LoRAでRLHFファインチューニングを試す方法はこちら

【Python】自然言語から画像を生成できるDeep-Dazeを紹介!使い方を解説!実際に画像を作ってみた

自然言語や画像処理の技術は日々進歩しています。その中で今回は自然言語から画像を生成できるdeep-dazeを使ってみたいと思います。

同じような技術を使っているアプリの使い方を解説しているのでそちらもぜひご覧ください。

あわせて読みたい
【Dream by WOMBO】twitterで話題の画像生成アプリの使い方を解説!言葉から画像ができちゃう!? 今回紹介するのはtwitterで話題となっている画像生成アプリDream by WOMBOです。 これまでも画像生成のアプリは出てきましたが、今回紹介するアプリはなんとキーワードを指定するとそれに沿った画像を生成してくれます。こちらのアプリはApp Store、Google play、またはウェブ上で利用できます。

以下のgithubを参考にしています。

https://github.com/lucidrains/deep-daze

目次

Deep-Dazeとは

Simple command line tool for text to image generation using OpenAI’s CLIP and Siren

Deep-DazeとはOpenAIの「CLIP」と「Siren」を使った、テキストから画像生成する簡単なコマンドラインツールです。また、Pythonでも利用することができます。

生成できる画像

mist over green hills (霧で覆われた緑の丘)
meditative peace in a sunlit forest(森林浴)
a psychedelic experience on LSD(LSDによる幻覚症状)

実行環境

This will require that you have an Nvidia GPU or AMD GPU

  • Recommended: 16GB VRAM
  • Minimum Requirements: 4GB VRAM (Using VERY LOW settings, see usage instructions below)

実行にはNvidia GPUまたはAMD GPUが必要であると書かれています。

そこで今回はGoogle Colaboratoryを使います。

実行コード

Deep-Dazeをインストール

!pip install deep-daze

画像を生成しよう

以下のコードで画像を生成できます。textの部分を変更していろいろ生成してみました。

num_layers, save_every, epochs以外にもいろいろ設定できるので詳しくはこちらを見てください。

from deep_daze import Imagine

imagine = Imagine(
    text = 'cosmic love and attention',
    num_layers = 24,
    save_every = 20,
    epochs = 5
)
imagine()

生成した画像

超新星爆発です!なんだかきれいですね。

supernova explosion(超新星爆発)

架空の生物っていいですよね。

fire breathing huge wyverns(火を吐く巨大なワイバーン)

save_gif = Trueとするとgifが最後に生成されます。

動きがあると一味違いますね。

supernova_explosion.gif

最後に

今回はDeep-Dazeを使ってテキストから画像を生成してみましたが、テキストを画像にするというのは面白い発想だと思いました。

実行時間に関しては、やはり画像を生成するだけあってGoogle Colaboratoryを使用しても数時間かかってしまいました。これで画像をつないで動画でも作れないかと考えていましたが難しそうです。

今後の発展が楽しみなので情報は追っていくようにしたいと思います。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

目次