PSM

Pプログラミング S初心者の Mメモ書き

pythonでcsvファイルを読み込む

1 はじめに

いつか集計しようと思って,趣味の麻雀の記録をexcelでとっていたのですが,この度ついに実行に移すことになりました.

2 やったこと

exelで集計していたデータをpythonで読み込みます.
使用環境は3系(python3.6.0)でJupyter Notebookを利用しています.

今回はpandasのread_csv()を利用して読み込みました.
名前からしてもcsvしか読み込んでくれなさそうなので,エクセルで作成したファイルを[cmd+shift+s]でファイル形式をcsvに変えて別名保存しておきます.
早速以下のスクリプトを動かすと

pd.read_csv("../Data/mahjong_log.csv")
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8c in position 1: invalid start byte

と怒られました.
google先生に尋ねながらread_table()を試してみたりしましたが,やっぱり同じエラーを吐いてきます.

Rのときと同じように,エディタにコピペしてencoding変えて保存したらうまくいくんでしょうけど,この先データを更新するたびに,その作業をするのも面倒です.

と考えたところで,Rのように読み込み時に文字コードをencoding="sjis"で指定してやったらうまくいくんじゃないかと,試してみたら無事読み込んでくれました.

3 サンプルコード

というわけでサンプルコードは以下.

import pandas as pd
pd.read_csv("hoge.csv", encoding="sjis")

次はとりあえず点数を順位に変換して平均順位などを出したいと思います.

それでは.