演習課題「列名の変更」
右のコードエリアではCSVファイルがDataFrameとして読み込まれ、problems変数に代入されています。
problemsの列名は順に「問題名」「ランク」「難易度」ですが、これをそれぞれ「problem_name」「rank」「difficulty」に変更し、結果のDataFrameを表示してください。
採点の前にはすべてのセルを実行し、ノートブックを保存してください。
※有料会員になるとこの動画をご利用いただけます
詳しい説明を読む
#02:データの読み込みと前処理
このチャプターでは、分析するデータを読み込み、列名変更や欠損値処理などの前処理をおこないます。
problems = pd.read_csv("csv/problems.csv")
submissions = pd.read_csv("csv/submissions.csv")
problems.columns = ["problem_name", "rank", "difficulty"]
submissions.columns = ["problem_name", "bytes", "score", "language", "time"]
submissions = submissions.dropna(how="all") # 全列の値が欠損値であるような行を削除
submissions[submissions.isna().any(axis=1)] # 欠損値を含むような行を抽出
submissions = submissions.dropna() # 欠損値を含む行を全削除
submissions[submissions.duplicated()]