グーグルは、簡単なコマンドでコンピュータを乗っ取ることができる AI ツールの開発に取り組んでいます。によると情報、社内では Project Jarvis と呼ばれているこのツールは、Chrome ブラウザでインターネットを閲覧し、製品の購入や航空券の予約などのタスクを実行できます。
伝えられるところによると、このツールは、Microsoftのものと同じように、コンピュータ画面のスクリーンショットを撮り、「ボタンをクリックしたり、テキストフィールドに入力するなどのアクションを実行する前にショットを解釈」することで機能するという。物議を醸す 想起ただし、これはユーザーのコンピュータの動作を保存および取得するために使用されます。
Jarvis の機能をよりよく比較するには、分析機能があります。アントロピックの発売先週、JavaScript コードを記述して実行できる Claude Large Language Model (LLM) が発表されました。ただし、ソフトウェア アプリケーションを操作するプログラマー向けにカスタマイズされた Claude とは異なり、Jarvis はブラウザベースであると伝えられており、ショッピング、航空券の予約、およびさまざまな生産性タスクを行う、より主流のユーザーに向けてマーケティングされることが想像できます。
マッシュ可能な光の速度
生産性の向上と特定の日常的なタスクの自動化は、Google がキラー ユースケースを求めて自社の AI 製品の多くで採用してきた方向性です。 Googleは、Gmailやドキュメントでテキストを要約したり書き込んだりするWorkspaceアプリ向けのAI機能を備えているが、競争は熾烈を極めている。 Googleは、最近発表されたとされるOpenAIに遅れを取っている。o1 と呼ばれる推論モデルこれは、より自律的な Web ブラウジング機能を備えたものに間もなく進化する可能性があります。
レポートによると、Project Jarvis は、Gemini LLM の最新バージョンのリリースとともに 12 月に開始される可能性があります。