演習課題「重複の特定(シリーズ)」
コードエリアには、シリーズ s が定義されています。
このシリーズ s に含まれる重複している値を特定して、その箇所をTrue
, False
で出力してください。
- True
: その値より前に重複している他の値あり
- False
: その値より前に重複している他の値なし
採点の前にはすべてのセルを実行し、ノートブックを保存してください。
※ 回答時にはprint(s)
をコメントアウトして回答してください。
演習課題「重複の特定(データフレーム)」
コードエリアには、データフレームdfが定義されています。
このデータフレームdfに含まれる重複している行を特定して、その箇所をTrue
, False
で出力してください。
- True
: その行の値がすべて一致する行が、それより前の行にある
- False
: その行の値がすべて一致する行が、それより前の行にない
採点の前にはすべてのセルを実行し、ノートブックを保存してください。
※ 回答時にはprint(df)
をコメントアウトして回答してください。
※有料会員になるとこの動画をご利用いただけます
詳しい説明を読む
#09:重複の特定(duplicated)
このチャプターでは、重複している値や行を特定する方法を学習します。
- duplicatedメソッドを用いることで、シリーズやデータフレームに含まれる重複している値や行を特定することができる
- シリーズの例:
import pandas as pd
s = pd.Series([1, 2, 3, 1, 5, 2, 4])
print(s.duplicated())
- シリーズsのそれぞれの値について、それ以前に重複している値が他にあるかを調べ、True, Falseで重複している箇所を表している
- データフレームの例:
import pandas as pd
df = pd.DataFrame([["Kirishima", "ruby"], ["Kirishima", "python"], ["Kirishima", "ruby"]], columns=["student", "lang"])
print(df.duplicated())
- データフレームのそれぞれの行について、その行の値がすべて一致する行が、それより前の行にあるかを調べ、True, Falseで重複している箇所を表している
- シリーズの例: