プログラミング言語アイコン
Python×AI・機械学習入門編2: 話者認識をしよう
Python×AI 機械学習入門 声優識別AIを創る
キャンペーン実施中

キャンペーンページを見る

チャプター一覧

01:話者認識の概要を知ろう (3:49) 無料公開中
ここでは、話者認識について学習します。機械学習で話者認識を行い、扱える問題を確認し、機械学習を行うためのPythonのツールについて紹介します。
02:SVMを利用してみよう (11:29) 無料公開中
ここでは、SVMと呼ばれる機械学習のパターン認識モデルを分類問題に適用する手順を確認します。さらに分類の様子を描画してSVMによる分類のイメージをつかみましょう。
ここでは、音声データとはどのようなデータなのか確認します。高音のデータと低音のデータを描画したしてみて、違いを確認しましょう。
ここでは、音声データをそのままSVMに与えて、話者認識をしていきます。さらに、この手法の問題点を考察します。
ここでは、音声データをフーリエ変換して求められる特徴量を使って話者認識することで予測精度の向上を目指します。さらに、この手法の問題点を考察します。
ここでは、1つの音声データから時間ごとに複数の特徴量を取り出して利用することで、予測の精度の向上を目指します。フーリエ変換によるパワースペクトルだけでなく、音声の特徴量として知られているMFCCも利用します。
ページの先頭へ戻る