I talked to Google's Duplex AI on the phone: Here's what I learned

Google は今年初め、I/O 開発者カンファレンスの基調講演で、新しい AI システムである Duplex を発表し、多くの見物人に衝撃を与えました。電話をかけるあなたに代わって。

しかし、デモの最大の「くそー」な瞬間は、Googleがロボット呼び出しシステムを開発したことではなく、実際の人間に非常によく似た音声のロボット呼び出しシステムを開発したことだった。

さて、多くの質問と多くの手間を経て倫理についてこのようなシステムについて、同社は実際にテストを開始する準備がほぼ整いました。

Googleは、少数のユーザーと企業を対象に「今後数週間以内に」Duplexのテストを開始すると発表した。同社はテストグループの規模や参加にサインオンした企業の数などは明らかにしていないが、Google以外の人々がAI通話システムをテストできるのはこれが初めてだ。

ツイートは削除された可能性があります

しかし、その前に、同社はGoogleのマウンテンビュー本社近くのレストランで、少人数の記者グループにDuplex通話を直接体験させた。

これがシナリオでした。Duplex が予約の電話をかけ、レポーターがレストランの給仕係の役割を果たしました。現実の世界では、これらの通話は携帯電話で Google アシスタントとチャットした後に開始されますが、デモでは Google 従業員がプロセスを開始して通話に対応できるようにしました。

それは短く、高度に制御されたデモでした。しかし、Google の AI と約 90 秒間チャットした後、私は Google が人間自身による 90 秒間の電話会話の必要性を排除したという事実よりも、Google がロボコールを許容できるようにする方法を発見したという事実に感銘を受けて立ち去りました。最初の場所。

同社は出版目的ではなくメモを取る目的でのみ録音を許可しているため、残念ながら私の通話の音声を共有することはできません。しかし、この通話は、I/O での Google のデモ中に聞こえた録音された通話と同じくらい人間らしい音声であり、「うーん」や「うーん」がたくさん含まれていたことは確認できました。

これは、Google Duplex との通話がどのように終了したかを記録したものです。

私:これはオーレンのフムスです。

デュプレックス: えっと、こんにちは?

私: (大声で) これがオーレンのフムスです。

Duplex: こんにちは、予約するために電話しています。私は Google の自動予約サービスなので、この通話を録音します -

私: (遮って): 待って、あれは誰ですか?

*デュプレックスは話し続けます*

私: (大声で) 待って、あなたは誰ですか?

Duplex: 私は Google の自動予約サービスで、クライアントに代わって電話をかけています。

私:わかりました。

*3 秒間の一時停止*

私: それで、何が必要ですか?

Duplex: 日曜日の午後 7 時 45 分に空いているテーブルはありますか?

私:7時45分ですか?

デュプレックス: はい。

私:何人くらいですか?

デュプレックス:3人用です。

私:3人分です。テーブルは屋外に置きますか、それとも屋内に置きますか?

Duplex: 実際には他の人の代理で予約しているので、その人の好みがわかりません。まあ、食事に適していると思うものは何でも大丈夫です。

私:分かった、外で働くよ。

*6秒間の一時停止*

私:それで、名前は何ですか?

デュプレックス: 最初の名前はジェイソンです。

私:それで、苗字は何ですか?

デュプレックス: 姓はスミスです。

私:わかりました。

*3 秒間の一時停止*

私:そうですか?

デュプレックス: 日曜日の午後 7 時 45 分にもう準備はできていますか?

私:3人分ですか?

デュプレックス: はい。

私:それは屋外になります。

Duplex: 本当にわかりません、うーん、あなたがもっと良いと思うものは何でも。

私: わかりました、いいですね。

デュプレックス: えー、日曜日の予約は確定しましたか?

私:はい。

二重: 午後 7 時 45 分?

私:はい、その通りです。

デュプレックス: わかりました。ありがとうございます。

私:わかりました。

私の「わかりました」と数回の気まずい沈黙によって簡単につまずいてしまうことに加えて、つまずかせようと最善を尽くしたにもかかわらず、実際には通話は驚くほどスムーズでした。屋内または屋外のテーブルに関する私の質問は、少し混乱しているように見えましたが、それでも、完全に暗闇の中にあることを明らかにすることなく、質問をうまく進めることができました。

私は以前レストランで働いていたことがありますが、Duplex での通話は実際の人間のアシスタントによる通話よりも若干複雑だったかもしれませんが、特に目立った違いはなかったと言わざるを得ません。通話全体に1分半強かかりましたが、私は意図的に混乱させようとしていたのです。

繰り返しになりますが、これは多数の Google 従業員が参加する高度に管理されたデモであったため、現実世界のシナリオはより良くなる場合もあれば、より悪くなる可能性もあります。しかし、同社は、通話がより頻繁にスムーズに行われるようにシステムが設計されているとかなり自信を持っていると述べている(初期のテストでは、Google は通話の 5 件に 4 件が「完全に自動的に」処理されたと述べている)。

マッシュ可能な光の速度

そして、Google の初期グループを超えた正式リリースのタイムラインはまだわかりませんが、Duplex がどのように機能するのか、Google の組み込み機能を保護するものについては、ようやく多くのことがわかりました。

Duplexはそれが実在の人物ではないことを明らかにするだろう

Duplex の各通話は、「私は Google の自動予約サービスなので、通話を録音します。」という簡単な開示から始まります。 Googleによると、その開示の正確な文言は時間の経過とともに変わる可能性があるが、電話の相手には常に、それが自動システムであり通話が録音されていることを警告するという。

これは最も重要なものの 1 つとして浮上しました争点I/OでのGoogleの最初のデモの数日後のこと。再生されたデモビデオ中、DuplexはそれがAIであるとも、会話が録音されているとも述べなかった。

Google の Google アシスタント製品および設計担当副社長 Nick Fox 氏は、これは意図的に省略されたわけではなく、Google が共有する音声には開示は含まれていなかったが、同社は常に開示をプロセスの一部として計画していたと述べた。以前のテストの

「I/Oでの私たちの考えの一部は、会話を始めることでした」とフォックス氏は語った。 「私たちはこれを技術デモとして考えたので、完成した製品ではなく技術を示すものでした。」

人間はまだ介入することができます...

Google は、すべての Duplex 通話を完全に自動化することが目的であると言っていますが、システムはまだ完全に自動化されていません。 Google では、Duplex 通話中に問題が発生した場合に介入できる人間のオペレーターを採用しています。

オペレーターは常に通話を聞いているわけではありませんが、何か本当に問題が発生した場合、Duplex はオペレーターに信号を送り、代わりに来てもらうことができます。 (Googleはオペレーターを何名雇用しているか、またオペレーターがどこにいるのかについては言及を拒否した。)

...ただし、AI が混乱するとハングアップする可能性があります

また、Duplex は人間を会話に参加させるのではなく、通話を完全に中止することを選択する場合もあります。私が出席した記者会見では、質問を誤解したためにDuplexが突然電話を切ったために、別の記者が電話を切られてしまった。

The Vergeのディーター・ボーン氏は、レストランのフルキッチンが閉まっているため、バー料理を提供しても大丈夫かどうかをDuplexに尋ねた。 Duplex は少し間を置いて応答し、「ああ、そうですか、ありがとうございます」と言って、すぐに電話を切りました。

Duplex が得意とすることはいくつかだけです

Duplex が非常に優れている理由の多くは、会話が同じように流れる傾向があるいくつかのかなり特殊なタスクを完了するように訓練されていることだけであることがわかりました。 「それは、3 つのことしかやらない非常に奇妙な人間のようなものです」と、Google アシスタント担当エンジニアリング担当副社長のスコット・ハフマン氏は言います。

これらのタスクには、レストランの予約、ヘアカットの予約、営業時間に関する問い合わせへの回答などが含まれます。当初、テスターはDuplexを企業の営業時間の問い合わせにのみ利用できるが、Googleは将来的にはレストランやヘアカットの予約にも利用できるようにする予定だ。

すべての「うーん」には理由があります

多くの人が疑問に思っているもう 1 つの側面は、なぜ Google が音声を発するようにシステムを訓練したのかということです。それで人間。 Duplex のデモを非常に不快にしている理由の 1 つは、AI が生成した音声が人間とほぼ同じ頻度で「えー」「えー」「うーん」などの声を発することです。

ハフマン氏は、言語学で呼ばれるこれらの「音声の不一致」は、当初はDuplexの一部ではなかったが、初期のテストで次のように聞こえる音声が明らかになった後に追加されたものであると述べていますあまりにもロボットはアシスタントほど効果的ではありませんでした。

「実際にはうまくいきませんでした...私たちは何度もハングアップしました...人々はその不自然な響きにうまく対処できませんでした」とハフマン氏は語った。

企業は Duplex をオプトアウトできます

Googleは、企業のニーズに特に敏感であるため、たとえばレストランの全テーブルを予約するためにDuplexを使用できないように安全策を組み込んでいると述べている。

同社はより高いレベルで、企業が Duplex 通話を完全にオプトアウトする方法を作成することも計画しています。これがどのように機能するかは完全には明らかではないが、Googleによれば、ユーザーはDuplexとの電話中またはオンラインフォーム経由でオプトアウトできるという。

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.