「BERT/GPT-3/DALL-E 自然言語処理・画像処理・音声処理 人工知能プログラミング実践入門」を読んで
こちらの本は、AIによる自然言語処理・画像処理・音声処理を実践するための入門書です。
本屋などの人工知能やPythonの本が置いてあるところに行くと、この色合いの本が並んでいることが多いです。
この本を手に取る人は、最新の自然言語処理・画像処理・音声処理の技術に関心のある方だと思います。
私もその中の一人なので、少しでも興味がある方におすすめです。
【注意点】レビューについては、私の独断と偏見で書かれているので、本の価値を保証するものではありません。そのことを念頭に置かれた上で一つのレビューとして見てください。
概要
この本では、比較的新しい技術に簡単に触れることができます。
全体的に、こんな技術があるんだよ~、ちょっと使ってみよう!って感じです。
実行環境については、Google Colaboratoryを使っていますが、一部でColab Proでも実行が必要になるので注意が必要です。
分野ごとのキーワードは以下の通りです。
GiNZA, Huggingface Transformers, BERT, GPT-2, T5, GPT-3
これら以外にもGoogle Cloud Platformで提供されている機械学習のクラウドサービスの使い方についても触れられています。
上記の中でGPT-2を使ったチャットボットの作り方とDeep Dazeの使い方について記事にしているので、よければご覧ください。
対象者について
この本は、初心者でもある程度Pythonについて知っている人でもコードをコピペするだけでいいので、幅広いレベルの人が楽しめると思います。
ただ、ネットで調べれば分かるようなことが多いので、例えば、GiNZAの使い方を知りたいからこれを買おうとするのはもったいないと思います。その点では、幅広い分野の技術を試してみたいと思う方なら読んでみる価値があると感じました。
- これから人工知能のプログラミングを学習する方
- 様々な分野の技術を学びたい方
- 新しい技術について知りたい方
良かった点
とりあえず、色んな技術に触れることができるので、こんなことができるようになるんだと知識はつく点は良いと思います。
また、簡単に実行できる点も良いと感じました。
例えば、Huggingface Transformersを使って「テキスト分類」「質問応答」「要約」「テキスト生成」「言語モデル」の学習と推論を行っていますが、パイプラインを用いて簡単に行うことができます。
残念な点
残念な点としては、仕組み自体の説明がないということです。
例えば、GPT-3のモデルは、GPT-2とどのような構造の違いがあるのか、なぜパラメータ数を増やすことができたのかなどについて触れられていません。
試してみよう!だけなので、私は少し物足りなさを感じました。
また、パイプラインなどを使っているので、自分でモデルを組みたいと思ってもそのあたりの学習ができない点も残念です。(それは、PytorchやTensorflowの本で学習してくれと言われればそれまでですが)
総評
この本は、とりあえず触ってみようという感じなので、例えばGPT-3について深く知りたい方へはお勧めできませんが、分野ごとにどのような技術があるのかを知る上では役に立つと思います。
コメント