Siri や Alexa に命令を促すために言葉につまづく日々は終わりました。AIこれまで以上に、より速く、より賢く、ポケットの中に座っている先見の明のある小さな人間のようになっています。
「人生を向上させる」推論、知性、会話スキルを持っていると宣伝され、アシスタントの応募者はここ 1 年で増えたばかりです。仕事のメモをまとめたり、勉強を手伝ったりしてくれるデジタル従業員が欲しいですか?栄養学やGLP-1の知識があり、ダイエットのアドバイスができる人はいませんか? (注意:彼らは医学の学位を持っていません。) あるいは、おそらく映画のアンディのようなアシスタントかもしれません。の プラダを着た悪魔: 煩わしいショッピングの返品を受け付けたり、不快なメールを送信したり、人気の本の最新刊を誰よりも早く入手したりできるものは何ですか?
開発者、大手テクノロジー企業、さらにはソーシャル メディア プラットフォームさえも、画像ジェネレーター、音楽メーカー、学習補助ツールなど、あらゆる種類の AI を活用したツールをリリースしていますが、デジタル アシスタントほど消費者市場に強力に売り込まれているものはほとんどありません。
ハイテク大手はデジタルアシスタントに大きく傾いています。彼らが何をしているのか、そして将来をどのように見ているかを見てみましょう。
チャットボットが歩くので、次世代アシスタントが ToDo リストに直接アクセスできるようになりました
マイクロソフトの副操縦士Windows ユーザーにとって頼りになる「コンパニオン」として昨年デビューし、Microsoft スイート全体で情報を移動し、テキストと要約を生成する機能、そして青春時代の SF 叙事詩からそのまま出てきたような思い出のような機能を備えています。の物議を醸すリコールツール— PC の履歴全体を調べて、広告で見た青いドレスを見つけるなど、非常に具体的な個人的なブラウジングの質問に答えることができる、と Mashable の Kim Gedeon 氏は報告しました。
特定の Copilot AI 機能は現在、Windows サービスに組み込まれている。
OpenAI はマルチモーダルを発表していましたが、音声対応バージョン同月、インターネット探索チャットボットを導入し、より有機的に会話やリクエストに応答できるようになりました。
数か月前に行われたテストでは、ワイヤード、実験的に高度な AI 音声ヘルパーのようなvimGPTサービスの申し込みやフライトのオプションの検索など、Web ページ全体で複数のステップのタスクを実行できました。
「今から 1 年後、コンピューターの使用体験は大きく変わっていると思います」と vimGPT の開発者 Ishan Shah 氏は語ります。ワイヤード当時。 「ほとんどのアプリではクリック数が減り、チャットが増え、エージェントはウェブの閲覧に不可欠な部分になるでしょう。」
Apple の元 AI 部門責任者である Ruslan Salakhutdinov 氏も同様の見解を共有していました。 「Siri に何かを頼めば、はるかに影響力が大きくなり、Siri が問題を解決してくれます」とサラフトディノフ氏は語った。ワイヤード。
Google と Apple の最近のデモでは、アシスタントが視覚、聴覚、テキスト情報をリアルタイムで処理し、Siri や Alexa よりも会話的な方法で応答できるようになりました。これらは、さまざまなデバイス、アプリ、プラットフォームにわたって機能し、「個人プロファイル」を利用してタスクの完了方法を基本的に予測し、アクセスの問題を排除し、アシスタントの対話のイライラを軽減します。
マッシュ可能な光の速度
それは、シャーのような開発者やサラクトディノフのような研究者が理論化してからわずか 4 か月後のことでした。
そして、Apple は Siri の将来のビジョンを発表しました。
「アシスタント」はユニバーサル統合への入り口です
6 月 10 日の年次 WWDC 基調講演で、Apple はインターネットを破壊する機能を発表しました。Siriのアップグレード、「オリジナルのインテリジェントアシスタント」がより自然で、より文脈に即した、より個人的なものになると同社は説明した。 Microsoft の Recall と同様に、Siri はデバイスを調べて、非常に具体的なリクエストに答えることができます。
Apple は、オンデバイス処理を使用することで、写真を見つけたり、メモを要約したり、Apple のツールや隠れた機能をより深く理解できるようになると述べています。データを収集せずに。また、テキストベースのストーリーの作成や画像の生成など、先駆的な生成 AI タスクも実行できます。同社は、最初のアップデートに続いて、OG をさらに「個性的で有能にする」機能を追加する予定であると付け加えた。他の AI モデルも組み込む予定です。Googleのジェミニ。
Siri のこの「新時代」は、Apple のより大規模な「インテリジェンス」推進の一部であり、派手さはなく、内部的に統合されており、全体的により繊細なピッチ次世代アシスタントに。 Apple の控えめな AI アシスタントは、インテリジェンス機能が同社の生産性向上マスコットに限定されたものではなく、Siri が使用されていないときでもアプリ全体に技術を組み込んでいることを強調しています。実際、同社はアップグレードされた「アシスタント」についてはほとんど宣伝せず、代わりに、Siri や Apple デバイスがすでに実行しようとしているタスクを強化する方法に焦点を当てていました。
他の企業も同様に、「アシスタント」という用語を段階的に廃止し、将来の目標を示唆する、より一般化されたタイトル、つまりユーザーにとってより広範囲にわたる使用例を選択しています。
5月に開催されたGoogleの年次I/Oカンファレンスで、CEOのサンダー・ピチャイ氏は同社の新しい「AIエージェント同氏は、AIを活用したアシスタント市場への同社の入札を表す用語を活用している。AIエージェントとは「推論、計画、記憶を示すインテリジェントなシステム」であり、「複数のステップを先読みする」ことができると説明した。 1 つのアプリや用途に含まれるわけではなく、ソフトウェアや複数のプラットフォームにわたって動作して、デジタル ライフのあらゆる側面を合理化できます。
「AI エージェント」は Google だけの用語ではありません。これは、「人間参加型」の障害なしにタスクを完了し、意思決定を行う AI ツールを指すためによく使用されます。この AI は、オプションが表示されるまで、ユーザーが行う必要があることにさえ気づかないことを、ユーザーに代わって実行します。マイクロソフトは独自の「副操縦士エージェント」たとえば5月。
「アシスタント」をめぐるこの用語のマーケティングは、それ自体が戦略であるように見えます。ベンチャーキャピタルファンドと投資家は、次のことに強い関心を持っています。エージェントに現金を注ぎ込み、 他の生成 AI 用途よりも。
しかし、他の用語も同様にフィルタリングされています。今月初め、仕事管理プラットフォーム Asana はワークフローを最適化する「AI チームメイト、「このタイトルは、「職場で AI と対話することについて人々がどのように考えるかという点で精神的な変化を生み出す」ために特別に選ばれたと、AI 責任者のペイジ・コステロ氏は説明した。テッククランチ。チームメイトが働くとあなたではありませんのためにあなたは、より適切な作業管理の決定を推論し、割り当てることができます。
デザインプラットフォームカンバ役割ベースのタイトルをすべて避け、Gen AI アシスタント機能を「Magic」という修飾語で説明しています。呼び名に関係なく、これらのアシスタントは、家庭用だけでなく、教育から経営、医療に至るまで、さまざまな業界のヘルパーとして販売されています。
次は何ですか
Googleディープマインドの共同創設者ムスタファ・スレイマン氏は、将来のAIアシスタントはより個人的なもののように機能するようになるだろうと語った。「参謀長」
「それは一日を理性的に判断し、時間の優先順位を付け、発明を助け、より創造的になれるようになるでしょう…それは研究助手になるでしょうが、同時にコーチや仲間でもあります」とスレイマン氏は語った。CNBC AIの未来についてインタビューで語った。
の時代からは、数世紀ではないにしても、数十年は離れています。人工知能ロボット執事。 Mashable のマイク・パール氏は次のように書いています。「テクノロジーは加速し、今では単純な書面によるプロンプトに、たとえば架空の人型ロボットや、私たちが思い起こそうとしている空想のシナリオなどの鮮やかな動画で応答できる機械が存在します。ロボットが現実世界の人間に喜びをもたらすように見えるのは、その人間がジェフ・ベゾスという名前。一方、平均的な個人にとって、ロボットは、完全な恐怖ではないにしても、ほとんどがフラストレーションの対象です。」
しかし、私たちはは顔のない AI ヘルパーの時代を生きています (そして積極的に参加しています)。ロボットとは異なり、このテクノロジーは今後もさらに改良され、無限に安価になることが期待されています。