Llama-2が登場!8bit+LoRAでRLHFファインチューニングを試す方法はこちら

「Python実践100本ノックシリーズ」を読んで|どんな人におすすめなのか

「Python実践データ加工/可視化100本ノック」「Python実践データ分析100本ノック」「Python実践機械学習システム100本ノック」「Python実践AIモデル構築100本ノック」において、実際にやってみた感想・レビューをまとめました。

それぞれの本について「概要」「読むのをおすすめする人」「良いと思った点」「残念だと思った点」「総評」の構成でまとめています。

【注意点】
レビューについては、私の独断と偏見で評価しているだけなので、その本の価値を保証するものではありません。また、すべて第一版の本なので、最新の内容ではない可能性があります。
これらを踏まえた上で、一つのレビューとして参考にしていただければ幸いです。

目次

Python実践データ加工/可視化100本ノック

概要

三部から成る構成でデータ加工と可視化を実際にコードを動かして学びます。

「第一部 構造化データ」では、システムデータ・Excelデータ・時系列データの加工・可視化を主に学習します。

次に「第二部 非構造データ」では、言語データ・画像データ・音声データの加工・可視化を学習します。

最終部の「第三部 機械学習向けの加工と特殊なデータ加工」では、機械学習の前処理・特殊な加工と可視化を学習します。

全体を通して、様々な形式のデータを扱う上で必須となるデータの加工・可視化に重点をおいた本になっています。

読むのをおすすめする人

  • データの扱い方の基本を学びたい方
  • データを扱いたいが具体的に何をしたらいいのか分からない方
  • データについては取得できているが、どのように扱える形式にすればいいのか分からない方

良いと思った点

全体を通して、かなりの形式をカバーできているので、データの加工方法については手元に置いておきたい一冊だと思います。また、Excelデータの加工方法が丁寧に書かれていたので、実際の業務などでExcelを使う方はかなり役に立つのではないかと思いました。

そして、実際に自分自身が持っているデータに置き換えるだけである程度の加工ができる点がかなり良いと思います。例えば、株価のデータを扱いたいとなった時も時系列データの加工方法を応用するだけで扱うことができます。

また、pandasと呼ばれるデータ分析に使われるライブラリの扱い方を学べます。pandasを上手に扱えるようになれば、データ加工についてかなり得意になると思います。

・実際のデータに応用できる
・加工・可視化について幅広くカバーされている

・pandasの扱いを学ぶことができる

残念だと思った点

残念だと思った点としては、機械学習の前処理においてPytorchやtensorflowが使われていないことが挙げられます。私の肌感覚として、ディープラーニングにおいてモデルを作る場合は、上記のフレームワークを使う場合が多いと感じるので、その他のライブラリを使っている点は少し残念だと思いました。もちろん、どのような流れで前処理をすれば良いのかは分かるので、そこまでダメだというわけではないです。

・Pytorchやtensorflowを使った処理が書かれていない

総評

「Python実践データ加工/可視化100本ノック」は、シリーズの中で初めの方に読んでいた方がいい本だと感じました。データの扱い方を学びたい方は購入することをおすすめします。

Python実践データ分析100本ノック

概要

ウェブから情報が簡単に手に入るようになった現代で、誰でも機械学習を実行してみることができるようになりましたが、実際のデータというのはそのまま使えるものが少ないことが多いです。

この本は、実際のビジネス現場を想定した100問を解くことで、それらに対処できるように設計されています。

構成は、基礎から実践までを幅広く扱う四部構成になっています。

「第一部 基礎編」では、比較的きれいなデータからデータの読み込みに苦労するデータまでを例にデータ加工を実践します。

「第二部 実践編①」では、機械学習の技術を活用して顧客のデータを分析し、課題発見・解決を行います。

「第三部 実践編②」では、最適化問題に対してどのようにアプローチしていくかを学びます。

「第四部 発展編」では、画像認識・自然言語処理技術などを利用して、データ化されていない情報から顧客の潜在的な需要の把握などを行います。

全体を通して、現場で活躍することを目指して作られたデータ分析の実践書となっています。

読むのをおすすめする人

  • 実際に現場でデータがあり扱い方を学びたい方
  • ウェブから取ってきたデータを扱える形式にしたい方
  • ビジネスの現場で技術がどのように使われているのかを知りたい方

良いと思った点

データ分析において、データ分析の手法だけを教えることがあり不親切な印象を受ける教材がありますが、この本では、データ分析できる形に加工するためにはどうするべきかが書かれているのが良い点だと思います。

また、ビジネスにおいて活用できそうなデータを用いているので、実際に自分が用意したデータで分析をしようと考えたときにやりやすい点も良いと感じました。

・データ分析をする前段階まで解説している
・自分で用意したデータを分析するときにコピペできる部分が多い

残念だと思った点

残念という程ではありませんが、少し難易度が高いと感じました。

例えば、最適化問題に関して言うと、事前知識がないと少し理解することが難しいのではないでしょうか。

・最適化問題など知識がないと実際のデータに落とし込めない可能性がある

総評

データ分析を実際のデータで行う上で必要な情報が含まれている本だと思います。

少し難易度は高いと感じましたが、やり切ることができればかなり力がつきます。

Python実践機械学習システム100本ノック

概要

この本では、実際のビジネスの現場を想定した100問を解くことでデータ分析や機械学習を小規模ながら回す仕組みを構築していきます。

構成については、データ分析システムと機械学習システムの二部構成です。

「第一部 データ分析システム」では、システムという名前がついている通りデータ分析を通して小規模なシステムを構築します。

「第二部 機械学習システム」では、機械学習のモデル構築を行い、そのモデルを施策に繋げるための仕組みを構築していきます。

全体を通して、Python実践データ分析100本ノックと共通するところもありますが、データ分析を始めとした仕組化に重きをおいた本となっています。

読むのをおすすめする人

  • データ活用プロジェクトを成功させたい方
  • データ活用プロジェクトを定着させたい方
  • 仕組化を意識した継続性のある小規模システムを構築したい方

良いと思った点

データ分析というと分析手法に目が行きがちですが、しっかりとデータの整形についても分かりやすく書かれており実際のデータを扱う上で大切なことを学べる点が良いと思います。

また、分析手法についても数ページに渡って丁寧に説明されているので、分からないところがあれば分かるところまで戻ることが容易にできる点も良いと思います。

最も良いと思った点は、他の人に説明する上で便利なダッシュボードを作成できるようになることです。データ分析において重要なことは、説明した相手に伝わるかだと思っているので、その点でも伝えるためのツールとしてダッシュボードの作成方法を学習できるのは良い点だと思います。

さらに、大規模ではないものの継続的にデータ分析を行って施策に繋げる仕組みの作り方の例を学習できるので、どうやって機械学習などの技術を業務に取り入れれば良いのかが分からない人の手助けになるのではないかと感じました。

・データ分析だけではなく、データの整形から学べる
・分析手法についても学習できる
・ダッシュボードの作成方法を学べる
・継続性のある仕組み作りの手助けになる

残念だと思った点

残念だと思った点はありませんでした。

業務で活用したいと思う方が対象者だと思うので、そこまで高度な機械学習を行う必要性がない点を考えればよくまとまっていると感じました。

総評

上記の二冊と比べると、より業務で活用できることが書かれていたように思います。

データの傾向を見ることができるようにする上で役に立つコードがたくさんあったので、コードをコピペして独自のデータ用に改変するだけでも十分な分析ができると思います。

Python実践AIモデル構築100本ノック

概要

デジタルトランスフォーメーションという言葉が良く聞かれるようになり、更に機械学習やディープラーニング、データ分析などの重要性は高くなってきました。

本書は、教師なし学習、教師あり学習、機械学習発展編の三部構成になります。

「第一部 教師なし学習」では、教師なし学習であるクラスタリングと次元削減が扱われています。

「第二部 教師あり学習」では、教師あり学習である回帰、分類が扱われます。

「第三部 機械学習発展編」では、説明可能なAI、自動でのモデル構築について取り扱われます。

全体的には、比較的奇麗なオープンデータを用いて、どのようなデータの場合に、どのようなアルゴリズムを選択するべきなのか、という実践力をつけるための本となっています。

読むのをおすすめする人

  • 機械学習の用語や仕組みは知ってるけど、実装の仕方が分からない方
  • 一通り機械学習を触ってみたい方
  • データは持っているけど、どのアルゴリズムを選択すべきか分からない方

良いと思った点

教師あり学習や教師なし学習において代表的な手法が実装できる点が良いです。

また、モデルを構築して終わりではなくしっかりと評価まで解説している点も良いと思います。データの読み込みから加工、モデルの構築、モデルの評価まで分かりやすくまとめられています。

さらに、説明可能なAIということでモデルの精度が高ければ良いというのではなく、なぜそう分類されているのかの解釈の仕方まで触れられている点も良いです。

・様々な学習手法について学べる
・モデルの評価方法についても学べる
・AIが分類した要因についての解釈の仕方まで学べる

残念だと思った点

本書にも書かれていましたが、今回は比較的奇麗なデータを使っているので、実際のデータの読み込みなどで苦労する可能性があると思います。この点は、「Python実践データ分析100本ノック」でカバーされていますが、本書だけでデータを扱うとなると物足りないと感じました。

また、画像や言語などのデータを扱っていない点は残念だと感じました。

・実際のデータでは読み込みなどで苦労する可能性がある
・画像や言語などのデータを扱っていない

総評

機械学習の手法を手を動かしながら学べる書籍だと思います。

具体的なモデルの構築方法が学べるので、テーブルデータを持っている方は是非見て見てください。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

目次