※paizaに会員登録すると無料で動画学習コンテンツをご利用いただけます
会員登録する
#04:自己教師あり学習の広がり
このチャプターでは、自己教師あり学習の広がりについて学習します。
深層学習が抱えていたデータコストの問題に対するアプローチとして注目を集めたのが、自己教師あり学習です。
【自己教師あり学習】
データそのものが持つ情報を擬似的なラベルとして利用し、モデルが自ら課題を生成して解くことで、データの内在する構造を学習する手法。
【穴埋め問題】
「the cat is __ the mat」のように、文の一部を意図的に隠し、モデルにその欠損部分を予測させるタスク。
【ラベル付け不要】
人手によるラベル付けを必要とせず、Web上に存在するテキストや画像といった膨大な非構造化データを直接的に学習資源として活用できる。
【多様なモダリティへの展開】
言語データに限らず、画像、音声、ロボティクスなど、さまざまな分野に応用が広がっている。