演習課題「データフレームのマージ」
右のコードエリアには、データフレームdf1,df2が定義されています。
df1とdf2をstudent_id列をキー列としてマージしてください。
採点の前にはすべてのセルを実行し、ノートブックを保存してください。
期待する出力値
name student_id lang
0 Midorikawa 2 C++
1 Kirishima 1 Java
演習課題「データフレームのマージ」
右のコードエリアには、データフレームdf1,df2が定義されています。
df1はid列をキー列として、df2はstudent_idをキー列として、マージしてください。
採点の前にはすべてのセルを実行し、ノートブックを保存してください。
期待する出力値
name id student_id lang
0 Midorikawa 2 2 C++
1 Kirishima 1 1 Java
#01:データフレームのマージ
このチャプターでは、データフレームをマージする方法について学習します。
マージとは、2つのデータフレームを、ある列に基づいて結合すること
データベースでの「テーブルの結合」と同じような処理
マージ関数を使うと、2 つのデータフレームをマージできるimport pandas as pd
df1 = pd.DataFrame({"name": ["Kirishima", "Rokumura"], "student_id": [1, 2]})
df2 = pd.DataFrame({"student_id": [2, 1], "lang": ["Python", "Ruby"]})
print(pd.merge(df1, df2, on="student_id"))
引数 on
・どの列に基づいてマージするか指定する
・両方のデータフレームに共通の列名が存在する場合に引数onを省略すると、自動的にその列に基づいてマージされる
両者に共通しない列でマージしたい場合は、引数left_onと、引数right_onを使うdf1 = pd.DataFrame({"name": ["Kirishima", "Rokumura"], "id": [1, 2]})
df2 = pd.DataFrame({"student_id": [2, 1], "lang": ["Python", "Ruby"]})
print(pd.merge(df1, df2, left_on="id", right_on="student_id"))
引数left_on:左側のデータフレームのキー列を指定する
引数right_on:右側のデータフレームのキー列を指定する