Siri による「声紋」の保存に関してプライバシー上の懸念が浮上

クレジット:

プライバシーが失われつつある時代にあっても、Apple のデジタル アシスタント Siri を使用している人々は明確な懸念を共有しています。個人的な質問をする彼らの実際の声の録音は、処理のためにインターネット経由でリモートの Apple サーバーに送信されます。その後、それらはそこに保管されたままになります。 Appleはいつまでかは明らかにしない。

この音声録音は、スマートフォンや他のコンピューターによって生成されるほとんどのデータとは異なり、実際の生体認証識別子です。声紋は、偶然、ハッキング、または召喚状によって公開された場合、特定の人物に関連付けられる可能性があります。そして現在では音声認識アプリのブーム, このようなデータを蓄積しているのはAppleだけではありません。

この識別子をよりプライベートに保つ方法があるかもしれません。研究者らは、Siriのような音声認識アプリケーションを開発しているAppleや他の企業は、データ処理の一部を電話機上で直接実行できる可能性があると述べている。そうすれば、完全な録音を送信する代わりに、個人と明確に関連付けることが難しい特定の情報を送信することができます。

音声認識研究の主要拠点であるレイセオン BBN テクノロジーズ(マサチューセッツ州ケンブリッジ)のエグゼクティブバイスプレジデントであるプレム・ナタラジャン氏は、「ID に関するものはすべて電話に残しておくべきかもしれません」と述べています。同氏は、Appleにとって「音声そのものではなく、音声から機能を送信する」方が賢明かもしれないと述べている。

このアプローチでは、携帯電話のプロセッサとバッテリーへの負担は大きくなりますが、音声認識の品質は損なわれません。 「[フルボイス]信号にアクセスできないことは、意味のあるペナルティを課すものではないと言って間違いないと思います」とナタラジャン氏は言う。共有される生体認証データの量を制限するには、次のようなデバイスの例に従います。マイクロソフトのキネクト、プライバシー上の理由から、そのようなデータを機内に保持するように設計されています。

Appleの広報担当者であるTrudy Muller氏は、ユーザーが「今の天気は?」などの音声質問をすると音声録音が保存されることを認めた。

「このデータは、Siri の操作と、Siri の理解と認識の向上を支援するためにのみ使用されます」と彼女は言います。ミュラー氏は、同社がプライバシーを「非常に真剣に」受け止めていると付け加え、Siriがインターネット経由で送信する質問と回答は暗号化されており、ユーザーの音声の録音はAppleが生成したユーザーに関する他の情報とリンクされていないと述べた。 (ただし、Siri は、リクエストに応答できるようにするために、連絡先リスト、場所、保存されている曲のリストをアップロードします。)

クレジット:

なぜ声紋が重要なのかを知るために、昨年2歳の娘ケイリーの死で無罪となったフロリダ州の母親ケイシー・アンソニーの殺人裁判を考えてみましょう。ある時点で検察当局は、被告のコンピューターから行われた「クロロホルム」やその他の犯罪的な用語のインターネット検索を指摘した。アンソニーさんの母親は、検索語を「クロロフィル」のスペルミスとして自分で入力したと証言した。もし検索がSiriの音声で行われていれば、検察官と陪審員が実際に誰が「クロロホルム」と言ったかを判断することが可能だったかもしれない。 (Appleは、これまでに誰かの声紋を求める召喚状を受け取ったことがあるかどうかについては明らかにしなかった。)

一方、不適切なテキストを口述筆記したり、医療上の機密事項について Siri に質問したりして、Apple がハッキングされた (または悪意のある従業員がデータを公開した) 場合は、恥ずかしいコミュニケーションが公開されるだけでなく、自分の声にも残ることになります。ナタラジャン氏は、生体認証はまったく新しいプライバシーの問題を引き起こす可能性があると述べています。たとえば、抑圧的な政権に対する抗議活動の場所を検索している人は、そのデータがその政府に利用可能になった場合に問題が生じる可能性があります。 「抗議活動について質問する人々のグループがいる場合、残念なことに、現在ではその人々の音声生体認証が存在します」と彼は言います。

大手テクノロジー企業を含む一部の観察者は、Siriについてより広範な疑問を提起している。先月テクノロジーレビューが報告しましたIBMは従業員にこの機能を使用しないよう求めていたとのことこの決定は、連絡先リストやその他の企業の機密情報を保護する必要性によって動機付けられたとIBMは述べた。これは他の組織も共有すべき懸念だと一部の専門家は考えている。

「もし私が諜報機関や大企業を経営するとしたら、そのようなサービスを社内で許可することはないだろう」とストーニーブルック大学のコンピューター科学者でクラウドコンピューティングセキュリティの第一人者であるラドゥ・シオン氏は言う。

Siri の音声認識の仕組みは次のとおりです。質問またはリクエストを話すと、音声録音が Apple サーバーに送信されます。そこでは、音波を数値的に変換し、関連する特徴を抽出する特徴抽出と呼ばれるプロセスで録音が分解されます。これらは音声認識エンジンを通じて実行され、ユーザーの発言を解釈してテキストにレンダリングします。次に、Siri は、インターネット、連絡先リスト (「お父さんに電話する」)、または現在地 (「一番近いタイ料理はどこですか?」) などのリソースを使用して、ユーザーのニーズに応えます。

一部の要素がそこに残るように、特徴抽出の最初の作業を電話機で直接実行できない理由はありません。たとえば、ピッチ パターンは話者を識別するためには重要ですが、何が話されたかを認識するためには重要ではありません。テクノロジーの観点から見ると、「認識装置が処理する内容を送信することはできますが、完全な波形は送信できません」とナタラジャン氏は言います。

これは完璧な解決策ではないかもしれないが、「特徴から音声信号を再構成することはできないので、これによりプライバシーが大幅に改善されるでしょう。そしておそらくより重要なことに、プライバシーの認識も改善されるでしょう。」と彼は言います。

ジェームズ・グラス氏はMITの上級研究員であり、その責任者である。音声言語システムグループによると、分散音声認識としても知られるオンボード処理が広範囲に研究されているという。完全な保護を提供するものではないと同氏は警告する: 「話者識別を行う生体認証手法は、一般に音声認識のみを行う手法と同様の信号表現を使用します。したがって、ローカルで[処理]を行っても、データが完全に匿名化されるわけではありません。それがあなたの目標でした。」

同氏は、声紋を匿名化する最も簡単な方法は、録音を携帯電話番号などの他のデータから切り離すことだと付け加えた。

「それは、ユーザーの声やクエリに合わせてシステムをパーソナライズすることが難しくなるということを意味しますが、よりプライバシーが確保されるのであれば、そのオプションを好む人もいるかもしれません」と彼は言う。 「これは私が提唱したい立場です。現在、一部のアプリが位置情報の使用許可を求めるのと似ています。」

より多くの音声アプリケーションがより多くの環境で登場するにつれて、生体認証識別子の保護がより重要になるだろうと、消費者がオンライン活動の追跡をブロックするのを支援するボストンのオンラインプライバシーソフトウェア会社Abineの共同創設者であるアンドリュー・サドベリー氏は言う。

「多くの場所で音声認識が急速に普及することになるという点で、これはまさに転機に近い瞬間だ」と彼は言う。 「そして、声を通じて人々を識別するというかなり優れた作業が容易になるでしょう。」

実際、Apple が完全な声紋を保存したい理由の 1 つは、そのようなサービスを提供するオプションを保持するためです。理論的には、音声認識装置は、話しているのが配偶者や子供ではなくあなたであることを認識し、個人に合わせた答えを与えることができます。 「別の電話から電話をかけたら、相手があなたを特定できたら、とても素晴らしいでしょう」とナタラジャン氏は言います。

それを可能にするのが、人々の実際の声を集めた膨大なデータベースです。このような機能はまだ推測の段階にある、と同氏は警告する。しかし、「すべてのイノベーションは、現時点では誰も計画していないことを実行することです」と彼は言います。 「私もそのすべてのデータにアクセスしたいと思っています。」