演習課題「重複の削除(シリーズ)」
コードエリアには、シリーズsが定義されています。
このシリーズsに含まれる、重複している後方の値を削除して出力してください。
採点の前にはすべてのセルを実行し、ノートブックを保存してください。
※ 回答時にはprint(s)
をコメントアウトして回答してください。
演習課題「重複の削除(データフレーム)」
コードエリアには、データフレームdfが定義されています。
このデータフレームdfに含まれる、重複している後方の行を削除して出力してください。
採点の前にはすべてのセルを実行し、ノートブックを保存してください。
※ 回答時にはprint(df)
をコメントアウトして回答してください。
※有料会員になるとこの動画をご利用いただけます
詳しい説明を読む
#10:重複の削除(drop_duplicates)
このチャプターでは、重複している値や行を削除する方法を学習します。
- drop_duplicatesメソッドを用いることで、シリーズやデータフレームに含まれる重複している値や行を削除した、新しいシリーズやデータフレームを取得することができる
- シリーズの例:
import pandas as pd
s = pd.Series([1, 2, 3, 1, 5, 2, 4])
print(s.drop_duplicates())
- シリーズに含まれる、重複している後方の値を削除できる
- 重複の判定方法は、シリーズのduplicatedメソッドと同様
- データフレームの例:
import pandas as pd
df = pd.DataFrame([["Kirishima", "ruby"], ["Kirishima", "python"], ["Kirishima", "ruby"]], columns=["student", "lang"])
print(df.drop_duplicates())
- データフレームに含まれる、重複している後方の行を削除できる
- 重複の判定方法は、データフレームの duplicatedメソッドと同様
- シリーズの例: