【Python】自然言語から画像を生成できるDeep-Dazeを紹介！使い方を解説！実際に画像を作ってみた

2022年1月8日2025年1月24日

自然言語や画像処理の技術は日々進歩しています。その中で今回は自然言語から画像を生成できるdeep-dazeを使ってみたいと思います。

同じような技術を使っているアプリの使い方を解説しているのでそちらもぜひご覧ください。

以下のgithubを参考にしています。

https://github.com/lucidrains/deep-daze

Deep-Dazeとは

Simple command line tool for text to image generation using OpenAI’s CLIP and Siren.

Deep-DazeとはOpenAIの「CLIP」と「Siren」を使った、テキストから画像生成する簡単なコマンドラインツールです。また、Pythonでも利用することができます。

生成できる画像

*meditative peace in a sunlit forest*(森林浴)

*a psychedelic experience on LSD*(LSDによる幻覚症状)

実行環境

This will require that you have an Nvidia GPU or AMD GPU

Recommended: 16GB VRAM
Minimum Requirements: 4GB VRAM (Using VERY LOW settings, see usage instructions below)

実行にはNvidia GPUまたはAMD GPUが必要であると書かれています。

そこで今回はGoogle Colaboratoryを使います。

実行コード

Deep-Dazeをインストール

!pip install deep-daze

画像を生成しよう

以下のコードで画像を生成できます。textの部分を変更していろいろ生成してみました。

num_layers, save_every, epochs以外にもいろいろ設定できるので詳しくはこちらを見てください。

from deep_daze import Imagine

imagine = Imagine(
    text = 'cosmic love and attention',
    num_layers = 24,
    save_every = 20,
    epochs = 5
)
imagine()

生成した画像

超新星爆発です！なんだかきれいですね。

架空の生物っていいですよね。

**fire breathing huge wyverns(火を吐く巨大なワイバーン)**

save_gif = Trueとするとgifが最後に生成されます。

動きがあると一味違いますね。

最後に

今回はDeep-Dazeを使ってテキストから画像を生成してみましたが、テキストを画像にするというのは面白い発想だと思いました。

実行時間に関しては、やはり画像を生成するだけあってGoogle Colaboratoryを使用しても数時間かかってしまいました。これで画像をつないで動画でも作れないかと考えていましたが難しそうです。

今後の発展が楽しみなので情報は追っていくようにしたいと思います。

この記事が気に入ったら
フォローしてね！

Follow @note_zan_

よかったらシェアしてね！

URLをコピーしました！

マルチモーダルAIを学ぶ上で読んでほしい書籍『深層学習からマルチモーダル情報処理へ』

「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理人工知能プログラミング実践入門」を読んで

「Python実践100本ノックシリーズ」を読んで｜どんな人におすすめなのか

【Python】自然言語から画像を生成できるDeep-Dazeを紹介！使い方を解説！実際に画像を作ってみた

Deep-Dazeとは

生成できる画像

実行環境

実行コード

Deep-Dazeをインストール

画像を生成しよう

生成した画像

最後に

コメント

コメントするコメントをキャンセル

マルチモーダルAIを学ぶ上で読んでほしい書籍『深層学習からマルチモーダル情報処理へ』

「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理人工知能プログラミング実践入門」を読んで

「Python実践100本ノックシリーズ」を読んで｜どんな人におすすめなのか

マルチモーダルAIを学ぶ上で読んでほしい書籍『深層学習からマルチモーダル情報処理へ』

「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門」を読んで

「Python実践100本ノックシリーズ」を読んで｜どんな人におすすめなのか

【Python】自然言語から画像を生成できるDeep-Dazeを紹介！使い方を解説！実際に画像を作ってみた

Deep-Dazeとは

生成できる画像

実行環境

実行コード

Deep-Dazeをインストール

画像を生成しよう

生成した画像

最後に

コメント

コメントする コメントをキャンセル

マルチモーダルAIを学ぶ上で読んでほしい書籍『深層学習からマルチモーダル情報処理へ』

「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門」を読んで

「Python実践100本ノックシリーズ」を読んで｜どんな人におすすめなのか

「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理人工知能プログラミング実践入門」を読んで

コメントするコメントをキャンセル

「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理人工知能プログラミング実践入門」を読んで