Appleが「Hey Siri」の仕組みを説明

Appleが「Hey Siri」の仕組みを説明

  • Lamiyi
  • 0
  • rhahw
Appleが「Hey Siri」の仕組みを説明

Apple は、機械学習ブログに「Hey Siri」機能の仕組みを説明する記事を掲載しました。

「Hey Siri」機能を使うと、ハンズフリーでSiriを起動できます。非常に小さな音声認識エンジンが常時稼働し、この2つの単語だけを聞き取ります。「Hey Siri」を検出すると、Siriの残りの部分は、次の音声をコマンドまたはクエリとして解析します。「Hey Siri」検出器は、ディープニューラルネットワーク(DNN)を用いて、各瞬間の音声の音響パターンを音声の確率分布に変換します。そして、時間積分プロセスを用いて、発話したフレーズが「Hey Siri」であったという信頼度スコアを計算します。スコアが十分に高ければ、Siriが起動します。この記事では、その基盤となる技術について解説します。この記事は、機械学習についてはある程度の知識があるものの、音声認識についてはあまり詳しくない読者を対象としています。

Appleが「Hey Siri」の仕組みを説明

興味深いことに、iPhone が最初に「Hey Siri」というコマンドを認識しなかったとしても、自動的にもっと敏感な状態になり、2 回目の試行でイベントを認識する可能性が高くなります。

基本的な閾値、つまり通常の閾値と、通常はSiriが起動しない下限閾値があります。スコアが下限閾値を超えても上限閾値を超えていない場合、真の「Hey Siri」イベントを見逃した可能性があります。スコアがこの範囲内にある場合、システムは数秒間、より敏感な状態に移行します。そのため、ユーザーがフレーズを繰り返すだけで、それ以上の努力をしなくてもSiriが起動します。このセカンドチャンスメカニズムにより、システムのユーザビリティが大幅に向上します。この非常に敏感な状態は短時間のみであるため、誤報率が大幅に上昇することはありません。

詳細については、以下のリンクをクリックしてください。

続きを読む [Carson経由]

Appleが「Hey Siri」の仕組みを説明