techrmc’s blog

ICT大好きな中小企業診断士のブログです

【書評】Pythonによるあたらしいデータ分析の教科書第2版(著者:寺田学ほか、翔泳社)

Pythonでのデータ分析の仕方を解説した初学者向けの解説書です。Pythonの実行環境は、venv仮想環境上のJupyterLabを用いています。データ分析の裏にある理論はごく簡単に触れる程度にとどめられ、実施例が豊富に説明されています。データ分析の理論を学びたい人にはもの足らないかもしれませんが、難解な理論より具体的な実施例を学びたい人には最適です。

利用している主なツール類は、

  • Numpy
  • pandas
  • Matplotlib
  • scikit-learn
  • Requests
  • Beautiful Soup 4
  • MeCab

です。

データ分析の基本として、分類、回帰、クラスタリングなど、主だったデータ分析手法が紹介されています。

応用例としては、Webページからのデータ収集(スクレイピング)、TF-IDFやポジ・ネガ判定といった自然言語処理機械学習による画像分類も解説されています。