Pythonデータ分析入門編11:テーブルごとのデータ分析

{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "531a1da9",
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd\n",
    "import seaborn as sns\n",
    "\n",
    "\n",
    "submissions = pd.read_csv(\"csv/submissions.csv\")\n",
    "submissions.columns = [\"problem_name\", \"bytes\", \"score\", \"language\", \"time\"]\n",
    "submissions = submissions.dropna()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "1d66fc15",
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.4"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}

{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "531a1da9",
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd\n",
    "import seaborn as sns\n",
    "\n",
    "\n",
    "submissions = pd.read_csv(\"csv/submissions.csv\")\n",
    "submissions.columns = [\"problem_name\", \"bytes\", \"score\", \"language\", \"time\"]\n",
    "submissions = submissions.dropna()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "1d66fc15",
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.4"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}

この動画を見るにはpaiza会員登録のうえ
有料会員登録が必要です

無料会員登録して始める

演習1

問題ログインすると模範解答や入力を見ることができます

演習課題「言語ごとのバイト数のランキング」

右のコードエリアではsubmissions変数にスキルチェックの提出データがDataFrameとして代入されています。submissionsをlanguage列でグループ分けしてbytes列を選択し、それの平均値をとって値を昇順でソートしたものに対して、その値をx軸、インデックスをy軸にとった横倒し棒グラフをseabornのbarplotメソッドで描画してください（結果は言語ごとのバイト数の平均値のグラフになります）。採点の前にはすべてのセルを実行し、ノートブックを保存してください。

Tips

動画へ戻る

次のチャプターへ前のチャプターへ

※有料会員になるとこの動画をご利用いただけます

詳しい説明を読む

＃03:テーブルごとのデータ分析

このチャプターでは、読み込んだデータをテーブルごとに分析します。

データの読み込みと前処理

import pandas as pd
import seaborn as sns


problems = pd.read_csv("csv/data_problems.csv")
submissions = pd.read_csv("csv/data_submissions.csv")

problems.columns = ["problem_name", "rank", "difficulty"]
submissions.columns = ["problem_name", "bytes", "score", "language", "time"]
submissions = submissions.dropna()

問題ランクと難易度

grouped_by_rank = problems.groupby("rank")
diff = grouped_by_rank.mean().sort_values(by="difficulty")
sns.barplot(data=diff, x=diff.index, y="difficulty")

速い言語

正解データでないと実行速度の参考にならないので最初にフィルタリングする。

accepted = submissions.query("score == 100")
grouped_by_lang_ac = accepted.groupby("language") 
exec_time = grouped_by_lang_ac["time"].mean().sort_values()
sns.barplot(x=exec_time.values, y=exec_time.index, orient="h")

プログラミング学習 > Python3 > Pythonデータ分析入門編 > Pythonデータ分析入門編11: データ分析の実践 > テーブルごとのデータ分析

Pythonデータ分析入門編11: データ分析の実践

演習課題「言語ごとのバイト数のランキング」

＃03:テーブルごとのデータ分析

データの読み込みと前処理

人気言語

問題ランクと難易度

速い言語