演習課題「部分的な音声波形の表示」
右側のJupyter Notebookのコードエリアでは、sample/hi.wavファイルの音声波形の最初の100個分のデータを描画するプログラムになっています。
最初の50個分を描画するようにコードを修正してください。
コードを実行した後、結果を保存して、採点ボタンをクリックして、正解と表示されれば演習課題クリアです!
※ ノートの保存は、Jupyter Notebook画面の上側にある「File」をクリックし、「Save and Checkpoint」をクリックします。
#03:話者認識に利用する音声データを確認しよう
ここでは、音声データとはどのようなデータなのか確認します。高音のデータと低音のデータを描画したしてみて、違いを確認しましょう。
右クリック > ダウンロード > ダウンロード先のフォルダを開く > 再生
import librosa
import librosa.display
import matplotlib.pyplot as plt# 再生した音声の波形を描画する
a, sr = librosa.load('voiceset/kirishima_b01.wav')
librosa.display.waveplot(a, sr)# 波形を表すデータ: 振幅の数値の列
print(a)
print(len(a))
# サンプリングレート -> 1秒間のフレームの数
print(sr)# 6秒の音声なので、次がlen(a)と一致するはず
print(sr * 6)# 高音
a, sr = librosa.load('sample/hi.wav')
librosa.display.waveplot(a, sr)
plt.show()
# 低音
a, sr = librosa.load('sample/lo.wav')
librosa.display.waveplot(a, sr)
plt.show()# 高音
a, sr = librosa.load('sample/hi.wav')
librosa.display.waveplot(a[0:100], sr)
plt.show()
# 低音
a, sr = librosa.load('sample/lo.wav')
librosa.display.waveplot(a[0:100], sr)
plt.show()
- Matplotlib(マトプロットリブ) ... グラフ描画のライブラリ
https://matplotlib.org/
- scikit-learn(サイキットラーン)... 機械学習ライブラリ
https://scikit-learn.org/stable/
- サポートベクターマシン、通称SVM(エスブイエム)
https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html
- sklearn.model_selection.train_test_split
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
- LibROSA(リブロサ)... 音声データを扱うライブラリ
https://librosa.org/librosa/
- librosa.display
https://librosa.org/doc/latest/generated/librosa.display.specshow.html
- numpy ... 数値計算ライブラリ
https://numpy.org/ja/