NumPy / pandas / Matplotlib とは
NumPy、pandas、Matplotlib などのライブラリは組み合わせて使用することの多いライブラリで、それぞれ下記のような特徴を持っています。
- NumPy - 数値計算ライブラリ (numpy.org)
- C で実装された高速な多次元配列である
ndarray
(通称 NumPy 配列)、及び関連メソッドを扱うことができます。 Python のみで行列を表現しようとすると、配列の配列(要素ごとに可変長)を作ることになりますが、NumPy 配列ではn x m の固定サイズ、単一タイプのデータとして扱うことで非常に高速な計算処理を行えるようになっています。 - pandas – 数値解析ライブラリ (pandas.pydata.org)
- R 言語のような数値解析を行うことができるライブラリです。
データファイルの読み込み、加工、集計、可視化までを総合的に行うことができます。
データのプロットには内部で Matplotlib を使用しており、
pd.DataFrame.plot()
がラッパーとして提供されています。 - Matplotlib – グラフ描画ライブラリ (matplotlib.org)
- 単独でグラフを描画するために使用できるライブラリですが、pandas による計算結果を描画するために内部で使用されています。
NumPy / pandas / Matplotlib のインストール
Python 3.4 以降はパッケージ管理のための pip
コマンドが標準で搭載されているので、これを使って NumPy と pandas と Matplotlib をインストールするのがお手軽です。
まずは、pip
コマンド自体を最新にアップグレードします。
$ pip install --upgrade pip
引き続き、NumPy と Matplotlib のインストールを行います。
$ pip install numpy
$ pip install pandas
$ pip install matplotlib
これで、import numpy
、import pandas
、import matplotlib
といった感じでインポートできるようになります。
慣例になっている別名
各ライブラリを import
するときは、下記のように略称 (plt
, np
, pd
) を定義して使用するのが慣例ととなっています。
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
トラブルシューティング: tkinter モジュールが見つからない
import matplotlib.pyplot
などを実行したときに、下記のように tkinter
モジュールが足りないというエラーが出ることがあります。
ImportError: No module named 'tkinter'
tkinter
は GUI ライブラリの Tk を Python から利用できるようにしたモジュールです。
Tk 自体はもはや時代遅れの GUI ライブラリですが、matplotlib
ではまだ Tk を使用しているので、tkinter
のインストールが必要です。
Linux の場合は、python3-tk
パッケージを導入すれば、Python 内で tkinter
モジュールをインポートできるようになります。
$ sudo apt-get install python3-tk
Windows の場合は、Python のインストーラ を実行して、 “tcl/tk and IDLE” という項目にチェックをいれてインストールしてください。