AppleがSiriに音声認識を学習させる仕組みを説明

AppleがSiriに音声認識を学習させる仕組みを説明

  • Lamiyi
  • 0
  • rhahw
AppleがSiriに音声認識を学習させる仕組みを説明

Appleは、機械学習ジャーナルに新しい記事を掲載し、Siriがユーザーの声を認識できるようにトレーニングする方法を解説しました。AppleはこれをPHS(Personalized Hey Siri)と呼んでいます。PHSは、明示的登録と暗黙的登録の2つの方法でユーザーを登録します。デバイスのセットアップ時に、「Hey Siri」で始まるフレーズをいくつか話すように求められます。これが明示的登録です。Appleは、時間の経過とともに、主なユーザーが実際の状況で話した発話を登録していきます。これが暗黙的登録です。

「Hey Siri」対応の各デバイスには、話者ベクトルのコレクションからなるユーザープロファイルが保存されます。前述のように、明示的な登録プロセスの後、プロファイルには5つのベクトルが含まれます。図1のモデル比較段階では、受信したテスト発話ごとに対応する話者ベクトルを抽出し、そのコサインスコア(長さで正規化されたドット積)を、現在プロファイルに含まれている各話者ベクトルに対して計算します。これらのスコアの平均が事前に設定された閾値(λ)を超えると、デバイスが起動し、後続のコマンドを処理します。最後に、暗黙的な登録プロセスの一環として、最後に承認された話者ベクトルを、40までユーザープロファイルに追加します。

詳細については、以下のリンク先の投稿全文をご覧ください。

続きを読む

AppleがSiriに音声認識を学習させる仕組みを説明