OpenAI次世代推論モデルである o3 と o3 mini を発表したばかりです。
ライブストリームでは、リサーチ担当上級副社長の Mark Chen が特定のベンチマークでの o3 のパフォーマンスを示しました。o1と比較して、競技数学 (96.7 パーセント) や博士レベルの科学 (87.7 パーセント) などです。 OpenAI と ARC プライズ コンテストでは、新しい未公開データセットを含む ARC-AGI ベンチマークで o3 が 76% のスコアを獲得した経緯も共有されました。 ARC-AGI ベンチマークは、新しいタスクごとに新しい独特のスキルをその場で学習する能力をテストするように設計されています。
ツイートは削除された可能性があります
この発表により、12 日間の OpenAI毎日何か新しいことをデビューさせたマラソン。過去 12 営業日にわたって、OpenAI は AI ビデオ ジェネレーターをリリースしましたソラ、ビジョン付きアドバンストボイスモード、たくさんのことに加えて、製品そして特徴ChatGPTを作成するために設計された仕事や日常生活でよりシームレスに使用できるようになりました。
マッシュ可能な光の速度
関連項目:
o3 mini モデルは、パフォーマンスのバランスをとったコスト効率の高いモデルとして設計されています。 3 つの異なる努力レベルがあり、問題の難易度に基づいて推論時間の上限が調整されます。 CEOのサム・アルトマン氏は「驚異的なコスト対パフォーマンスの向上だ」と述べた。
つまり、OpenAI によると、o3 と o3 mini は驚くべきインテリジェンスの進歩を達成しました。しかし、まだ一般に公開する準備ができていません。しかし、OpenAI は本日より、安全性テストのための o3 および o3 mini への早期アクセスを許可します。へのアプリケーションモデルテストプログラムに参加する受け付けは順次受け付けており、1 月 10 日に締め切ります。