Python の Pandas ライブラリは、データ操作および分析を容易にするためのデータ型および関数群を提供します。
Pandas ライブラリの内部では、NumPy ライブラリの多次元配列 (ndarray
) や数値演算関数が使用されています。
先に NumPy に慣れておくと理解が早くなります。
pandas.Series はラベル付き 1 次元配列
pandas.Series
は、1 次元の NumPy 配列 (ndarray
) に、インデックス用のラベルを付加したデータ型です。
通常の配列データは 0、1、2 というインデックスで各要素にアクセスしますが、pandas.Series
では各インデックスに意味のあるラベルを付けることができます。
pandas.Series を生成する
pandas.Series
コンストラクタで、次のように初期データだけを指定すると、通常の配列と同様にインデックスとして 0、1、2 が割り振られます。
各インデックスにラベルを設定する
pandas.Series
コンストラクタで第 2 引数 (index
) を追加指定すると、明示的に各インデックスのラベルを設定することができます。
import pandas as pd
s = pd.Series([100, 200, 300], index=["aaa", "bbb", "ccc"])
# s = pd.Series([100, 200, 300], ["aaa", "bbb", "ccc"]) # 同上
print(s)
次のように、辞書オブジェクトから同様の pandas.Series
を生成することもできます。
data = {"aaa": 100, "bbb": 200, "ccc": 300}
s = pd.Series(data)
Matplotlib による描画
Pandas は Matplotlib と統合されており、簡単にチャート描画を行うことができます。
import matplotlib.pyplot as plt
import pandas as pd
s = pd.Series([100, 200, 300], index=["aaa", "bbb", "ccc"])
# 出力設定
fig = plt.figure(facecolor="white", layout="tight", dpi=72, figsize=(6, 3))
# Pandas の Series データを棒グラフとしてプロット
s.plot.bar()
# 必要に応じて画面に表示
plt.show()
# 画像として保存
fig.savefig("img-001.svg")