【Python】自然言語から画像を生成できるDeep-Dazeを紹介!使い方を解説!実際に画像を作ってみた
自然言語や画像処理の技術は日々進歩しています。その中で今回は自然言語から画像を生成できるdeep-dazeを使ってみたいと思います。
同じような技術を使っているアプリの使い方を解説しているのでそちらもぜひご覧ください。
以下のgithubを参考にしています。
https://github.com/lucidrains/deep-daze
Deep-Dazeとは
Simple command line tool for text to image generation using OpenAI’s CLIP and Siren.
Deep-DazeとはOpenAIの「CLIP」と「Siren」を使った、テキストから画像生成する簡単なコマンドラインツールです。また、Pythonでも利用することができます。
生成できる画像
実行環境
This will require that you have an Nvidia GPU or AMD GPU
- Recommended: 16GB VRAM
- Minimum Requirements: 4GB VRAM (Using VERY LOW settings, see usage instructions below)
実行にはNvidia GPUまたはAMD GPUが必要であると書かれています。
そこで今回はGoogle Colaboratoryを使います。
実行コード
Deep-Dazeをインストール
!pip install deep-daze
画像を生成しよう
以下のコードで画像を生成できます。textの部分を変更していろいろ生成してみました。
num_layers, save_every, epochs以外にもいろいろ設定できるので詳しくはこちらを見てください。
from deep_daze import Imagine
imagine = Imagine(
text = 'cosmic love and attention',
num_layers = 24,
save_every = 20,
epochs = 5
)
imagine()
生成した画像
超新星爆発です!なんだかきれいですね。
架空の生物っていいですよね。
save_gif = Trueとするとgifが最後に生成されます。
動きがあると一味違いますね。
最後に
今回はDeep-Dazeを使ってテキストから画像を生成してみましたが、テキストを画像にするというのは面白い発想だと思いました。
実行時間に関しては、やはり画像を生成するだけあってGoogle Colaboratoryを使用しても数時間かかってしまいました。これで画像をつないで動画でも作れないかと考えていましたが難しそうです。
今後の発展が楽しみなので情報は追っていくようにしたいと思います。
コメント