Pythonでのデータ分析の仕方を解説した初学者向けの解説書です。Pythonの実行環境は、venv仮想環境上のJupyterLabを用いています。データ分析の裏にある理論はごく簡単に触れる程度にとどめられ、実施例が豊富に説明されています。データ分析の理論を学びたい人にはもの足らないかもしれませんが、難解な理論より具体的な実施例を学びたい人には最適です。
利用している主なツール類は、
- Numpy
- pandas
- Matplotlib
- scikit-learn
- Requests
- Beautiful Soup 4
- MeCab
です。
データ分析の基本として、分類、回帰、クラスタリングなど、主だったデータ分析手法が紹介されています。
応用例としては、Webページからのデータ収集(スクレイピング)、TF-IDFやポジ・ネガ判定といった自然言語処理、機械学習による画像分類も解説されています。