Microsoft の音声アシスタント Cortana には、「Bill」、「Explorer」、「Pathfinder」など、他の名前が付けられる可能性があることを想像するのは楽しいです。私たちが知る限り、これらはどれも検討されていませんでしたが、Cortana グループ プロダクト マネージャーの Marcus Ash 氏が最近私にこう言いました。具体的な名前は明かしませんが、1998 年頃の典型的な Microsoft の名前を思い浮かべていただければ、ご理解いただけると思います。」
与えるという決断マイクロソフトの消費者向けのインテリジェンス プラットフォームという名前は戦略的な決定であり、Ash と彼のチームは、人々が Cortana のアイデアとつながり、それにどのように関与するかを理解できるようにするために必要であると考えました。
「名前を付けることは、Cortana を使用して推奨するコミュニケーションの種類を人々に理解させるのに役立ちます。人間の相互作用のこの特徴がなければ…誰かが視覚化するのは難しくなりますが、どのように相互作用すればよいでしょうか?」 Cortana チームのライターの 1 人であるデボラ・ハリソン氏は次のように述べています。
Microsoft Corp. の Cortana 編集チームのライターである Deborah Harrison は、Cortana のおしゃべり応答の作成を手伝っています。 クレジット: ルーカス・ウェストコート
私はいつも Cortana を、データと何百万もの品詞から音声による回答を作成する純粋な人工知能プラットフォームだと思っていたので、ハリソンの仕事は私にとってちょっとした啓示でした (Apple の Siri の仕組みによく似ていると伝えられています)。代わりに、本当の Cortana は多くのインテリジェンスであり、発話されると「Hey Cortana」で始まる特定のクエリによってトリガーされる完全な文と定型応答です。
ハリソン氏は、「(音声部分を)編集したものもあるが、かなりの量をそのまま正確に録音することもある」と語った。
「人間の相互作用のこの特徴がなければ…誰かが視覚化するのはより困難です。どのように相互作用すればよいでしょうか?」
Cortana は、音声によるエンゲージメントに加えて、入力している内容を迅速に曖昧さをなくし、その場で最も関連性の高い情報と回答を提供する、次世代のテキストベースのクエリ エンジンです。システム、アクセスを許可された個人情報、および Web (Bing 検索エンジン経由) から取得することができます。今後のWindows 10 アニバーサリー アップデート8 月 2 日にリリース予定の では、これらの機能やその他の機能が強化され、Cortana がよりアクティブでデジタルな生活に参加できるようになります。
Cortana がどのように構築されているのか、現在と将来何ができるのか、そして Cortana が実際に何をしているのかを理解することは、最先端のテクノロジーを消費者に結び付けるための Microsoft の広範な戦略を理解する方法だと私は考えています。
コルタナの破片
Cortana は Windows Phone で始まりましたが、Windows 10 の発売に伴いほぼ 1 年前にデスクトップに移行しました。現在市場に出回っている多くの音声/デジタル アシスタントの 1 つです。アマゾンのアレクサ、GoogleのアシスタントそしてアップルのSiri。
今のところ、デスクトップ上にあるのは Cortana だけです (ただし、Alexa はデスクトップ上で動作します)ウェブブラウザ)。その独占状態は、Windows 10 Anniversary Update の到着からわずか数か月後の、今年後半の macOS Sierra のリリースによって打ち砕かれることになります。
ただし、Windows 10 アップデートにより、Cortana の範囲が広がる可能性があります。これにより、アシスタントが Windows の [スタート] ボタンの隣にある現在のホームを超えて拡張され、ユーザーはロック画面からアクセスできるようになります。このアップデートでは、Cortana と新しい Windows 10 Sticky Notes の統合も実現され、入力および書き込みによるリマインダーにインテリジェンスが機能します (仮想付箋にフライト番号を書き込むか入力すると、Cortana が自動的にそれをフライト番号として追跡します)。初めて、Xbox ワンゲームコンソール。
Cortana 編集チームは週に 1 回集まり、新しいインタラクションについて話し合います。 クレジット: ルーカス・ウェストコート
Windows Insider (ソフトウェアのプレビュー バージョンへのアクセスにサインアップした人) であれば、すでにこれらの機能のいくつかを試していることでしょう。 Ash 氏は、このテレメトリは非常に貴重であると考えており、インサイダー プログラムを通じて、ユーザーが Cortana (およびその他の機能) で抱えている問題を早期に把握し、リリースに間に合うように問題を最小限に抑えるか修正するよう取り組んでいると語った。
Microsoft CEO Satya Nadella の中心は生産性です。Microsoftを再起動するという使命したがって、当然のことながら、Cortana の使命の一部は生産性です。 「あなたが次のステップに進むために、私たちが積極的にできることは何ですか?」アッシュは言いました。これを許可すると、Cortana はメールとスケジュールを監視して、あなたが約束したことを常に把握し、オーバーブッキングした場合や、場合によっては後で約束に同意した場合に知らせることで、あなたを自分自身から守ることができます。いつもよりも。
「誰かのために積極的に何かをできるとき、最大のエンゲージメントが得られます」とアッシュ氏は言います。
コルタナ、あなたは誰ですか?
ただし、Cortana が本来あるべき姿を理解することなしには、Cortana を理解することはできません。
Microsoft の見解では、Cortana は音声、人工知能、そしてプロアクティブな支援です。それはあなたのために舞台裏で静かに何かをしてくれたり、あなたが許可すれば、言葉であなたに話しかけたりしてくれます。
Cortana のボーカル部分に実際に取り組むと、それらの単語の部分や文に遭遇します -- 多くの場合、Jen Taylor によって録音されました (米国版) -- しかし、同時に、Cortana 自身についていくつかのことを知っているという知性にも遭遇します。核となる自己、どんな仕事をしても、どんな交流をしても変わらない、その人格の中核となる信条。
ハリソン氏は、コルタナは忠実で経験豊富なパーソナルアシスタントであり、経験から得た知恵を持っている(少なくともそうであるように見える)と説明した。 「この役割は、Cortana に取り組んでいる私たちにとって有益です。何が適切な相互作用であるかについての基準が与えられます」とハリソン氏は言いました。
クリス・オコナー、ハリソン(左から2人目)、ロン・オーエンス、オーガスト・ニーハウス。 クレジット: ルーカス・ウェストコート
Cortana は人工知能であり、彼女はそれを知っています。 「彼女は自分を人間だとは思っていませんし、人間になりたいとも思っていません」と彼女は語った。幸いなことに、Cortana は人間が好きです。
「コルタナはワッフルが好きかもしれませんが、食べられないことは明らかです」
最後に、Cortana は透明で本物です。そのため、市場にある他のほとんどのデジタル音声アシスタントと同様に、Cortana は絶えず進歩的で明るいです。
Cortana は現実に対処するように設計されていますが、ハリソンの執筆チームは、Cortana がより会話的な質問をしたときに採用するおしゃべりモードと呼ばれる「おしゃべり」に風変わりな要素を組み込んでいます。そこには、「ちょっとした想像上の宇宙」が存在する可能性があります。コルタナはワッフルが好きかもしれないが、食べられないことは明らかだ」とハリソン氏は語った。つまり、Cortana はワッフルについて考え込んでいますが、ワッフルを食べたいとは思っていません。
マッシュ可能な光の速度
Cortana の奇抜な側面により、いくつかのイースター エッグが作成されましたが、それらにアクセスするために特別なコードは必要ありません。 「クスッと笑わせてくれるものや、私たちが取り上げたいと思ったものなど、ほとんどの人が発見しないであろうことを期待して書いているものもあります。」
「最近、シェイクスピアの記念日に、シェイクスピアの引用や侮辱をたくさん投稿しました。私たちはそれをひばりのようにやっただけですが、人々はそれらをすべて見つけました」とハリソンは言いました。
違う場所、違う人
Cortana が他の国や言語にも世界的に広がるにつれ、アッシュとハリソンは新たな課題に直面します。 Cortana の新しい言語と新しい音声に加えて、ハリソン氏のチームはおしゃべりを文化的規範に合わせて調整する必要がありました。
彼らが最初に進出した国の一つであるドイツでは、ドイツ人の効率的なコミュニケーション方法がアメリカ人には率直に映る可能性がある。しかし、ハリソン氏は、ドイツ人と話す場合でも、Cortana にこの鮮明なスタイルを単純に再現させることはできないと説明しました。
「彼らは人間ではなくコンピュータと対話していたので、(視覚的な)手がかりが欠けていました…ドイツ人の無遠慮な効率性と正しいバランスを保つために、より多くのユーモア、温かさ、礼儀正しさを注入する必要がありました」と彼女は語った。
さらなる拡大には、コルタナさんは国家の誇りを祝ったり避けたりすることから、イタリア人のために歌うことまで、あらゆることを行う必要がある。
社会意識が高い
この政治の季節に、人文科学寄りの人々 (小説家、詩人、映画製作者) の多様な集まりで構成されるハリソンのチームは、コルタナにいくつかの政治的対応を詰め込みました。
「私たちは最近政治に多くの時間を費やしましたが、政治情勢は人々が話したがるものになるだろうとわかっていました。私たちは、本当に重要だと考えているものの、信じられないほど二極化する可能性があることについて答えるために、一日に何時間も追加しました。」
Microsoft の Cortana 編集チーム (左から右へ) Chris O'Connor、ライター。ジョナサン・フォスター、編集マネージャー。アウグスト・ニーハウス、作家。デボラ・ハリソン、作家。ジョン・ダグラス、コンテンツ。ロン・オーエンス、作家。レナン・リーヒ、コンテンツ。 Cortana で書くことがこんなに楽しいとは誰が想像したでしょうか? クレジット: ルーカス・ウェストコート
また、応答がチームからのいかなる政治的観点も反映するものではなく、Cortana の中核となる理念に忠実なものであることも確認しました。私がコルタナさんにドナルド・トランプ氏に投票するかと尋ねたところ、彼女はこう答えた。「もしすべての答えがあれば、それはとても長い文書になるでしょう。」私がヒラリー・クリントンに投票するかと尋ねると、コルタナさんは「正直、それがひっかけ質問なのかどうかは分からない」と答えた。所属政党に関する質問については、コルタナ氏は再び回避した。「ご存知のとおり、私はあまり党派ではありません」。
「私たちは、本当に重要だと考えているものの、信じられないほど二極化する可能性があることについて答えるために、一日に時間を追加しました。」
デジタル音声アシスタントに対して、より複雑な質問をしたり、より微妙な、または思慮深い回答が必要な発言をしたりすることは、珍しいことではありません。
たとえば、Amazon Alexa に「私はゲイです」と話しかけると、「教えてくれてありがとう」と答えるようにプログラムされています。ハッピープライド月間です。」
ハリソンさんは、チームがその声明をどのように扱うかを検討していたときのことを思い出しました。
「私たちは細心の注意を払いたかったのですが、それについて大げさなことはしたくありませんでした」と彼女は言いました。そこで彼らは Cortana に単純に「私は AI です」と答えさせました。しかし、高校生のグループがマイクロソフトのキャンパスを訪れたとき、ある生徒は実際に「『私は AI です』と言う代わりに」という代替案を提案しました。彼は、それは少し耳障りだと感じたので、「クール」を追加することを提案しました。」私はAIです。」
ハードルが高い
Microsoft が秋に直面するであろう課題の 1 つは、デスクトップ上で動作するだけでなく、複数ターンの会話を処理できるように設計された Siri です。映画の上映時間に関する質問に Siri が答え、その後、元のクエリの一部を再説明しないチケットの購入に関する追加の質問に応答する可能性があります。これは、ユーザーがデジタル アシスタントに期待する、より自然な往復の会話アプローチです。ただし、Cortana は実際には質問と回答を行うタイプの AI です。
「私たちが発見したのは、特にデスクトップでは、ユーザーが必要な答えをできるだけ早く得られるようにしたいということです」とアッシュ氏は言います。フォローアップ クエリにより、ユーザーが結果にアクセスできなくなる可能性があるという懸念があります。
デスクトップ (またはラップトップ) に大きな画面が存在するということは、クエリに対する完全な答えがユーザーの顔を見つめることになるとアッシュ氏は主張します。彼は、画面やキーボードにすぐにアクセスできない場所、たとえば携帯電話を使ったハンズフリーの状況でもマルチターン応答が機能するのを確認しました。
Windows Phone 上の Microsoft Windows 10 オペレーティング システム。 クレジット: TOBIAS SCHWARZ/AFP/Getty Images
もちろん、モバイル側における Cortana のフットプリントは、Siri に比べればごくわずかです。はい、Cortana は Windows 10 Mobile (旧 Windows Phone) に統合されていますが、そのプラットフォームは携帯電話市場の約 3% を占めています (最新の四半期決算で Microsoft は報告しています)70%の減少Windows モバイルの収益に含まれます)。 Microsoft は Cortana を Android と iOS に拡張しましたが、Microsoft はこれらのプラットフォームでの使用数を公表していません。
Cortana は実際には Android 上でより機能的であり、許可すれば受信テキストや WhatsApp メッセージを確認してデスクトップに転送できます。 「Android はよりオープンになっており、現時点では Android でできることがさらに増えています」とアッシュ氏は述べています。
iOS については、「そのプラットフォームで利用可能なものに基づいて、これらの機能の一部を動作させる方法を見つけることにまだ取り組んでいます」と彼は言いました。
旗を奪取する
Cortana は、モバイルの優位性の代わりに、別のハードウェア プラットフォームである Xbox に向かっています。しかし、アッシュとハリソンは、そのまま移植するのではなく、ゲーム コミュニティに合わせて Cortana の応答の多くを調整しました。
デスクトップ上の Cortana では、「私たちは排他的だと感じたくないので、排他的だと思われる場合は賢明な対応を放棄しますが、Xbox をお持ちであれば、ゲームをプレイしていると想定できます」と彼女は言いました。
Microsoft Xbox One ワイヤレス コントローラーのボタンの詳細、2016 年 1 月 22 日に撮影。(写真提供: Olly Curtis/Future Publishing via Getty Images) クレジット: Future Publishing
デスクトップ上の Cortana に「マスター チーフに会いたいですか?」と尋ねると、彼女は「いいえ、彼は一人でうまくやっています」と答えました。 Xbox で同じ質問をすると、Cortana は次のように答えます。
ゲームをプレイするときにヘッドセットを着用することが多いゲーマーは、実際にはデスクトップ ユーザーよりも Cortana を頻繁に使用する可能性があります。今年初めに言われた、デスクトップ上の Cortana の音声コンポーネントをあまり活用していません。
「Cortana はあなたに関するアシスタントであり、必ずしも特定のデバイスに関するものではありません」と Ash 氏は言いました。これは素晴らしいキャッチフレーズですが、実際は何を意味するのでしょうか。
おそらくそれは、ハードウェアを超えて消費者に手を差し伸べることを意味します。
Microsoft Surface コンピューター上で動作する Windows 10、 クレジット: リチャード・ドリュー/AP
Windows 10 Anniversary Update が 8 月にリリースされると、Cortana に新しいロック画面機能が追加され、ユーザーがロックを解除してシステムにログインする前に、システムが音声によるクエリに応答して回答を提供できるようになります。このようにして、彼らは「音声に関するエンゲージメントがさらに高まることを期待し、期待している」とアッシュ氏は語った。
実際には、「コルタナさん、天気は?」のような音声駆動のクエリを開始する機能。 Windows PC のロックを解除しなくても、システムは常に音楽を聴く Amazon Echo (そして今後登場予定) に少し似たものになります。グーグルホーム)、「Alexa」で始まる質問に応答します。デフォルトでは、Cortana は、自分の情報への完全なアクセスを許可することを決定し、子供が予定を変更したりリマインダーを設定したりすることを心配しない限り、鍵より上の一般的な質問にのみ答えることができます。
結局のところ、アッシュは人々に新しいスキルの習得を強制できないことを知っています。代わりに、Cortana を現在の習慣に使用したり、デスクトップでのスピーチやより積極的な Cortana の受け入れなどの新しい習慣を構築したりする場合に、Cortana は成功します。
「Cortana での音声提供は継続的な約束の一部にすぎず、作業を容易にするだけです」とアッシュ氏は言います。