Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理 の感想

アマゾンで購入する

参照データ

タイトルPythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理
発売日販売日未定
製作者Wes McKinney
販売元オライリージャパン
JANコード9784873116556
カテゴリ » ジャンル別 » コンピュータ・IT » コンピュータサイエンス

購入者の感想

この本は、Pythonを使って本格的なデータ分析をする際に必須となる外部ライブラリである、IPython、NumPy、pandas、matoplotlibについての導入的な解説書です。
この本は以下のような本ではありません。
・Pythonを使ってデータ分析の基礎や方法について学ぶ
・Pythonを使ったデータ分析の実際について豊富な事例とともに学ぶ
本の具体的な構成をみてみると、全435ページのうち、
・導入、使用ライブラリの概略、セットアップについて (1章) 14ページ
・IPythonについて (3章) 38ページ
・NumPyについて (4, 12章) 76ページ
・pandasについて (5~7, 9, 10章) 214ページ
・matoplotlibについて (8章) 32ページ
・具体的なデータ分析事例 (2, 11章) 62ページ
という配分となっています。つまり8割がひたすらライブラリの説明ということです。
その説明は、データ分析の際に必要となる主な機能について、数行〜十数行のコードサンプルとともに説明するというものです。言い換えれば、読んで楽しいようなものではない、ということでもあります。
この本は、すでに他の環境やツール、プログラミング言語等でデータ分析の経験があって、Pythonへの移行を考えている人、または経験のあるなしに関わらず、いま目の前に分析すべきデータがあって、それをPythonを使って分析しようと試行錯誤している人が読んで、初めて意味がある内容だと思います。データ分析の基礎や経験、必要性がない人が読んでも、いったいそのライブラリのその機能がなぜ必要なのか、そのコードサンプルが何をしているのか、さっぱりわからないのではないでしょうか。
データ分析の経験も基礎もない人は、まずは他の環境や言語ででもいいので、データ分析そのものについて勉強して、できれば具体的な事例やプロジェクトにも取り組んでから、この本に進むのがよいと思います。

Pythonは、日本ではマイナーな印象のあるスクリプト言語ですが
保守性の高さや実行速度などのメリットから、海外では広く用いられています。
とりわけ、豊富なライブラリが提供されていることもあり、科学計算などのデータ分析の用途では定番です。

 ・NumPy/SciPy(数値演算ライブラリ)
 ・pandas(R言語に似た、データ分析環境)
 ・matplotlib(グラフ/可視化ライブラリ)

本書は、上記に挙げたpandasの開発者が、
Pythonと上記ライブラリを用いたデータ分析の基本を説明したものです。
データの操作・処理・クリーニングなどといった基本から、
データの集約や時系列データの取り扱いといった実務上の重要項目まで抑えてあります。
オライリーの和書としては「RとRubyによるデータ解析入門」という類書がありますが、
取り上げている題材(金融・経済データ)など、本書の方が実践的な内容を取り上げているように感じました。
ページ数は多めですが、(Pythonを既に習得していれば)実務上必要十分な情報が収まっています。
「データ分析をしろと言われたけどR言語が取っつきにくくて、、、」というWebプログラマにもおすすめです。

データ分析に必要な統計学など基礎知識については本書の範囲外なので
同様にPythonで説明されている「Think Stats

あなたの感想と評価

コメント欄

関連商品の価格と中古

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

アマゾンで購入する
オライリージャパンから発売されたWes McKinneyのPythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理(JAN:9784873116556)の感想と評価
2017 - copyright© みんこみゅ - アマゾン商品の感想と評価 all rights reserved.