演習課題「CSVファイルの読み込み」
/home/ubuntu/csvにはstudents.csvというファイルが用意されています。このファイルをDataFrameとして読み込み、結果を表示してください。採点の前にはすべてのセルを実行し、ノートブックを保存してください。
期待する出力値
name | language | age | |
---|---|---|---|
0 | kirishima | ruby | 15 |
1 | rokumura | python | 16 |
2 | midorikawa | c | 16 |
演習課題「ヘッダ行のないCSVファイルの読み込み」
/home/ubuntu/csvにはstudents.csvというファイルが用意されていますが、このファイルにはヘッダ行がありません。デフォルトコードのcolumn_namesの要素が順に列名となるように、このファイルをDataFrameとして読み込み、結果を表示してください。採点の前にはすべてのセルを実行し、ノートブックを保存してください。
期待する出力値
name | language | age | |
---|---|---|---|
0 | kirishima | ruby | 15 |
1 | rokumura | python | 16 |
2 | midorikawa | c | 16 |
演習課題「欠損値扱いする値の指定」
/home/ubuntu/csvにはstudents.csvというファイルが用意されています。"himitsu"という文字列と-1という数値がNaNとして扱われるように、このファイルをDataFrameとして読み込み、結果を表示してください。採点の前にはすべてのセルを実行し、ノートブックを保存してください。
期待する出力値
name | language | age | |
---|---|---|---|
0 | kirishima | NaN | 15 |
1 | rokumura | python | NaN |
2 | NaN | c | 16 |
#02:pandasによるデータの読み込み1
このチャプターでは、pandasを使って外部からデータを読み込む方法を学習します。
ノートブックと同一階層にあるcsvディレクトリ以下のsample.csvを読み込む。import pandas as pd
students = pd.read_csv("csv/sample.csv")
students
ヘッダ行のない3列のsample2.csvを読み込む。import pandas as pd
column_names = ["student_name", "favorite_lang", "student_age"]
students2 = pd.read_csv("csv/sample2.csv", header=None, names=column_names)
students2
NA・空文字列・NULLなどはデフォルトでNaNとして読み込まれる。import pandas as pd
students3 = pd.read_csv("csv/sample3.csv")
students3
na_values引数でNaNとして読み込む値をリストで指定できる。import pandas as pd
nas = ["secret", -1]
students4 = pd.read_csv("csv/sample4.csv", na_values=nas)
students4