先月、615億ドルのAIスタートアップ人類がゲームのライブストリームを設定しましたけいれん。 Twitchでは、LiveStreamsは新しいものではありませんが、これは少し違っています。ポケモンレッド。
私たちは今です1か月、そしてライブストリームはまだ進んでいます。しかし、クロードは持っています進行中ではありませんそんなに。そして、この速度では、人類のAIエージェントは、誰もいなかったように、おそらく最高ではないかもしれません。
人類によると、最初に発売「Claude PlaysPokémon」プロジェクト、AIエージェントの以前のバージョンのClaudeは、いくつかの非常に基本的なタスクで失敗しました。たとえば、人類によると、クロード3.5は2024年6月のほぼすべての戦いから逃げようとします。
参照:
数ヶ月といくつかのバージョンのクロードの後に、人類は厳しい変化があると述べました。 2025年2月、人類はクロード3.7ソネットにポケモンを演奏する際に渦巻きを与えました。
「数時間以内に、クロードはブロックを破った。数日後、それは霧を打ち負かした」と人類は言った。 「古いモデルが達成することをほとんど希望していないという進歩。」
マッシャブルなライトスピード
Anthropicは、Claude 3.7 Sonnetが前もって計画し、目標を覚え、以前のバージョンのAIエージェントとは異なり、その間違いから学ぶことができると述べました。また、ナレッジベースを構築し、画面を見ました、およびシミュレートされたボタンの押しも。
しかし、もともとゲームで作られたProgress Claude 3.7 Sonnetは停滞しているようです。
たとえば、ライブストリームの視聴者見た条項3.7が取ったように78時間ゲームでムーン山を通り抜ける。 Redditで、ゲーマー推定通常、同じ段階を通過するのに数時間しかかからないこと。
参照:
クロードは、同じ道を歩き回り、ゲームを回そうとするときに壁にノックすることがよくあるのを見ることができます。
特にテキストボックスがクロードの「思考」を展開しているため、ライブストリームは魅力的です。
人類のエンジニアによると、とのインタビューでArs Technica、クロードは、ポケモンの戦いなどのテキストを含むゲームの側面でより簡単な時間を持っています。ただし、地図上で町から町へと移動するなど、ゲームのより視覚的な側面に苦労しています。
Claude 3.7 Sonnetは、以前のClaudeモデルよりもゲームではるかに進んでいるため、進歩がありました。しかし、AIがまもなく世界を引き継ぐことができるという警告については、私たちはまだ現実であることに近いものではありません。クロードにはまだ151個のポケモンがあります。