演習課題「教師データとテストデータの変更」

右側のJupyter Notebookのコードエリアでは、動画で説明した方法で話者認識を行なっています。

train_test_splitでの教師データとテストデータの分割時のrandom_stateの値を813813に変更して、分類の予測結果を確認してください。

コードを実行した後、結果を保存して、採点ボタンをクリックして、正解と表示されれば演習課題クリアです!

※ ノートの保存は、Jupyter Notebook画面の上側にある「File」をクリックし、「Save and Checkpoint」をクリックします。

演習課題「長い音声データでの学習のパラメータ調整」

右側のJupyter Notebookのコードエリアでは、教師データとしてvoicelongフォルダの音声ファイルを利用し、テストデータにvoicesetの音声ファイルを利用しています。

画面では19のテストに正解していますが、SVMのgammaパラメータを変更して、44以上のテストで正解できるようにしてください。

コードを実行した後、結果を保存して、採点ボタンをクリックして、正解と表示されれば演習課題クリアです!

※ ノートの保存は、Jupyter Notebook画面の上側にある「File」をクリックし、「Save and Checkpoint」をクリックします。

※有料会員になるとこの動画をご利用いただけます
詳しい説明を読む

#06:音声の時間別の特徴量を利用して予測の精度を改善しよう

ここでは、1つの音声データから時間ごとに複数の特徴量を取り出して利用することで、予測の精度の向上を目指します。フーリエ変換によるパワースペクトルだけでなく、音声の特徴量として知られているMFCCも利用します。