あなたの車と実際に会話する準備をしてください。
いいえ、ニュージャージー州を通過するためにナビゲーションシステムに向かって叫んだり、ブルックリンとモントークの間のどこかで車がガス欠になって泣き叫んだりするような種類ではありません。
いいえ、これらは実際に、それらの面倒な会話を回避する可能性のある本当の会話です。
Nuance Communications は、Siri のオリジナルの音声認識および音声技術を担当する会社であり、最も古く最も尊敬されている音声認識システムの 1 つである Dragon Naturally Speaker の親会社です。彼らは何年もの間、ほぼすべての大手自動車メーカー向けに音声アシスタントの開発に取り組んできました。彼らは現在、ドライバーと乗用車と人間のインタラクションにおける次の段階の準備を進めている。そして試乗させてもらいました。
非常に晴れた非常に快適な夏の朝、ニュアンスはブランドを誇示する新しいクライスラー パシフィカに乗って私のオフィスにやって来ました。ミニバンは素敵ですが、物語ではありませんでした。ニュアンスはこれをコンセプト車両として使用しており、タッチ スクリーン (元のコンソールは下の引き出しの中にありました) と、車の乗客 6 人全員に音声を提供する新しいマイク アレイを改造しました (私の声が見えました)。マイクは車の屋根の私の頭のすぐ上に埋め込まれていました)。ニュアンスは、乗客干渉キャンセル (PIC) と呼ばれるものを使用して、ドラゴン ドライブ システムが 1 人の乗客またはドライバーが話しているときに背景ノイズを分離し、残りのマイクのリスニングをシャットダウンします。
Dragon Drive に寒いと伝えると、私のゾーンに合わせて自動的に温度を調整してくれました。 クレジット: lance ulanoff/mashable
ただし、ニュアンスはハードウェアのアップグレードを提供するだけではありません。画面とマイクは、ニュアンスが自動車パートナーに自社の優れたソフトウェア ソリューションで何が可能かを説明する手段であり、おそらく次の自動車ラインのアイデアを刺激するものです。
クライスラーのドライバーの後ろに座っていたニュアンス・ドラゴン・ドライブ・ソリューションズ・マーケティング・マネージャーのロバート・ポリカーノ氏は、重要なテーマの1つは人工知能であり、「人工知能を音声認識や自然言語処理に加えてどのように使用して、より状況に応じたものにするか」だと語った。より関連性の高い結果を提供し、より人間味のあるものにします。」
過去 2 年間にわたり、ニュアンスは、音声認識システムをトレーニングし、特にエンゲージメントにコンテキストを追加するためにディープ ニューラル ネットワークと機械学習を使用し始めました。
つまり、私の隣の運転席にいた Dragon Drive シニア プロダクト マネージャーの Lior Ben-Gigi 氏によると、インテリジェンス レイヤーが存在し、人々の発言だけでなく、以前の行動、スピーチ、車で利用可能なコンテキストも使用するということです。指標、さらには意図さえも。
たとえば、ベン・ジジは「こんにちは、ドラゴン」と言ってドラゴン ドライブを促し、アトランティック シティへのルートをナビゲートするように頼みました。
マッシュ可能な光の速度
「燃料のことは考えていない。ただアトランティックシティに向かうだけだ」とベン・ジジさんは語った。
システムはナビゲーションに同意し、車の燃費とタンク内のガソリン量を調べました。視覚的な警告で燃料を補給しないと遠くまでは行けないと警告し、ガソリンスタンドを探すよう勧めた。ベン・ジジが承諾すると、ドラゴン・ドライブはベン・ジジが好むブランドに焦点を当ててガソリンスタンドを設立した。
マイク アレイを手に入れると、さらにマイク アレイを手に入れて、さらに... クレジット: lance ulanoff/mashable
同様に、Ben-Gigi が Dragon Drive に、Discover Card を受け入れるガレージのある駐車場を午後 1 時から午後 3 時まで探すよう依頼したところ、それらの条件に適合する場所がすぐに特定され、その車両を処理できるガレージを舞台裏で検索しました。サイズ。また、以前のドライブでそのリクエストを指定していれば、車椅子対応駐車場のあるガレージも探します。
これは、Dragon Drive の組み込み学習機能の一部です。時間の経過とともに、音声プロフィールを作成していれば、あなただけでなく乗客のプロフィールも構築できます。
ニュアンスの AI、車載音声アシスタント ソリューションも、組み込み学習とクラウドベースのスマート機能を組み合わせている点で珍しいものです。 Dragon Drive は、車、センサー、乗客からコンテキスト情報を取得する一方で、Parkopedia (駐車場データ用) や Pandora などの音楽サービスなどのサードパーティ パートナーから必要なクラウド データも収集しています。クラウドベースの情報は、テザリングされたスマートフォンまたは車内のモバイル ブロードバンド経由で取得できます。
このクライスラー パシフィカ ミニバンは、ニュアンス ドラゴン ドライブに少し変身しました。 クレジット: lance Ulanoff/mashable
クライスラー パシフィカでは、ニュアンスのドラゴン ドライブは、私が使用した他のよりモジュール式の車載アシスタントよりもコンテキストと意図をうまく処理できるように見えました。ある時点で、私たちは自然史博物館に行くルートを設定しましたが、途中でアイスクリームが食べたいと決心しました。 Dragon Drive システムは、ほんの数マイル離れた場所にあるアイスクリーム店を推奨しました。次に、目的地に近い場所を見つけるように依頼すると、それが実行され、それが旅行の旅程に追加されました。これはすべて音声経由で行われ、Dragon Drive システム側で混乱が生じることはありませんでした。
ニュアンスはまた、自動運転車によって私たちが運転以外のことにもっと多くの時間を使えるようになる将来にも期待しています。私たちは、システムが曲を再生し、乗客がアーティストと曲を特定する必要がある音楽トリビア ゲーム「Dragon Tunes」をプレイしました。そうするためには、「わかりました」と叫ぶだけです。コンセプトカーの PIC システムは、誰が話しているのかを即座に識別し、応答させました。
しかし、洗練されたマイクアレイを使用していても、ドラゴンは誰が応答しているのか混乱することがありました。私たちは動いていなかったので、乗客の中にはかなり前かがみになったり、首を横に向けたりしており、それが接続の切断を引き起こした可能性があります。
ニュアンスは、独自のスクリーンとテクノロジーを車内に搭載し、将来の車内音声アシスタントを可能にしました。 クレジット: lance ulanoff/mashable
私が「こんにちは、ドラゴン」と言い、ビープ音を聞くために一時停止し、「寒いです」と付け加えたときはうまくいきました。そして、システムが私のゾーンに合わせて車の温度を調整しました。マイクアレイのおかげで、Dragon Drive は私がどこに座っているかを認識しました。
ニュアンスはすでにフォード、クライスラー、BMW などの自動車会社と協力して現在のニュアンス システムを統合していますが、ドラゴン ドライブの未来は急速に到来しています。ベン・ジジ氏は、今後 2 年以内にこのようなシステムが市販車に搭載される可能性があると述べています。
デモを通して、私は Dragon Drive の自然な音色に衝撃を受けました。ベン・ジジはこれを「Expressive Text-to-Speech」と呼んでいます。 Appleの努力を思い出させたiOS 11 では Siri の音がより自然になりました。
これはニュアンスとアップルの共通点の 1 つですが、車載テクノロジーに対するアプローチは大きく異なります。
ポリカーノ氏は、アマゾンやアップルなどの企業が自動車業界向けに何か異なるものを構築しようとしている一方で、ニュアンスは不可知論的なプラットフォームを構築していると述べた。彼らにはエコシステムのアジェンダがある、と彼は言いました。
「AppleがAppleエクスペリエンスを構築している一方で、NuanceはBMWによるBMWエクスペリエンスの構築を支援している」とポリカーノ氏は語った。