pandas で DataFrame
オブジェクトの内容を CSV/TSV ファイルに出力するには、DataFrame#to_csv()
メソッドを使用します。
テスト用の DataFrame
ここでは、出力用の DataFrame
オブジェクトを次のように作成しておきます。
インデックス名に idx1
〜idx3
、カラム名に col1
〜col3
をセットしています。
CSV/TSV に出力する
to_csv() メソッドの基本
パラメーターなしで to_csv()
メソッドを呼び出すと、インデックス名やカラム名(CSV のヘッダー行)も含めて出力されます。
これは、パラメーターのデフォルト値が index=True, header=True
になっているからです。
df.to_csv("output.csv")
ちなみに、DataFrame
にインデックス名が明示的にセットされていない場合は、次のように 0, 1, 2 という連番が振られます。
TSV 形式で出力する (sep)
セパレーター文字はデフォルトでカンマ (,
) ですが、sep
パラメーターで任意のセパレーター文字を設定できます。
タブ (\t
) を指定すれば、TSV ファイルとして出力できます。
インデックス列やヘッダー行を出力しない (index, header)
インデックス列を出力したくないときは、index=False
パラメーターを指定します。
同様に、ヘッダー行(カラム名)を出力したくないときは、header=False
パラメーターを指定します。
col1,col2,col3
2,4,AAA
5,9,BBB
1,5,CCC
2,4,AAA
5,9,BBB
1,5,CCC
インデックス列のカラム名を指定する (index_label)
インデックス列のカラム名(ラベル)を指定するには、index_label
パラメーターを指定します。
デフォルトでは空文字列になってしまうので、カラム列を出力する場合は、この index_label
も設定しておくことをお勧めします。
id,col1,col2,col3
idx1,2,4,AAA
idx2,5,9,BBB
idx3,1,5,CCC