Python×AI・機械学習入門編2: 話者認識をしよう

(全6チャプター)

一部無料 有料プラン

概要

機械学習で音声認識を行います。音声データから特徴量を抽出する方法を学習し、SVMで分類します。

チャプター一覧

chapter 1

ここでは、話者認識について学習します。機械学習で話者認識を行い、扱える問題を確認し、機械学習を行うためのPythonのツールについて紹介します。

3:49
chapter 2

ここでは、SVMと呼ばれる機械学習のパターン認識モデルを分類問題に適用する手順を確認します。さらに分類の様子を描画してSVMによる分類のイメージをつかみましょう。

11:29
chapter 3

ここでは、音声データとはどのようなデータなのか確認します。高音のデータと低音のデータを描画したしてみて、違いを確認しましょう。

7:55
chapter 4

ここでは、音声データをそのままSVMに与えて、話者認識をしていきます。さらに、この手法の問題点を考察します。

9:17
chapter 5

ここでは、音声データをフーリエ変換して求められる特徴量を使って話者認識することで予測精度の向上を目指します。さらに、この手法の問題点を考察します。

7:07
chapter 6

ここでは、1つの音声データから時間ごとに複数の特徴量を取り出して利用することで、予測の精度の向上を目指します。フーリエ変換によるパワースペクトルだけでなく、音声の特徴量として知られているMFCCも利用します。

11:40

学習ステータス

Lv.1 

チャプター完了数
0 / 6チャプター
演習課題完了数
0 / 8問

レッスン一覧へ戻る