マイクロソフトは、自社の人工知能が年齢を推測したり、パックマンで勝ったりする以上のことができることを証明しようとしている。
水曜日、同社は発表した。AIを見るのための「しゃべるカメラ」アプリiOS視覚障害者が周囲を移動できるようにすることを目的としています。
その機能のリストは、ほとんど本当であるように思えます。書類をスキャンして内容を読み取り、手に持っている紙幣の額面を教えてくれ、バーコードをスキャンして何を持っているかを正確に知らせ、顔も学習します。あなたが知っている人々の表情を読み、その瞬間に目の前にあるものを説明しようとすることさえできます。
しかし実際には、Seeing AI が実際に視覚障害者にとって有用なツールとなるまでに、マイクロソフトにはまだやるべきことがたくさんあることは明らかです。 (同社もこのことをよく認識しています。アプリを起動すると最初に表示されるのは、「AI の認識は必ずしも正確であるとは限りません」という警告です。) 以下に、テストでの結果を示します。
テキストとバーコード
テキストやバーコードを適切に分析できるアプリはすでにたくさんあるので、それがこのアプリが最も優れた点であることは驚くべきことではありません。私たちが投げたテキストのほぼすべての断片を読み取ることができ、ほとんどのバーコードを簡単に識別できました。
これらの機能は他のアプリではかなり一般的ですが、Seeing AI の実装は、スキャンしようとしているものとアプリ内のカメラを並べるのに役立つという点で注目に値します。バーコードの場合、バーコードに近づくとビープ音が鳴り、カメラを文書の端に合わせるようにテキストでガイドされます。
印刷されたテキストの読み取りは少しぎこちないものの、正確でした。しかし、ほぼすべてのバーコードを簡単にスキャンできました (粉末ピーナッツバターの瓶が何らかの理由でつまずいてしまいました)。
マッシュ可能な光の速度
人と「景色」
ここからがさらに興味深いことになります。テキストやバーコードは別として、Seeing AI はマイクロソフトの AI アルゴリズムを大量に使用して、周囲の物体や人を識別します。これらは、Microsoft のアプリの初期デモの最も印象的な部分でしたが、私のテストでは物事はそれほどスムーズに進みませんでした。
私は机とソファから簡単に始めました。アプリは両方を簡単に認識しましたが、そこからはさらに悪化するため、私の期待が高くなりすぎたのかもしれません。
クレジット: SeeingG Ai
クレジット: AI を見る
次に、アプリが「チラシの束 [原文ママ]」と誤認した本の束と、いくつかのゲームが入ったミニ冷蔵庫を試しました。 AI が「床、屋内、机のようです」と返してきたのを見ると、これらすべての項目が技術的に存在するため、技術的には間違っていませんが、実際に目の前にあるものを把握しようとしていた場合には役に立たないようでした。
次に「人」機能を試してみました。これは、あなたの周りに何人いるかだけでなく、彼らの年齢や感情状態(表情に基づいて)を推定することもできるとしています。
Microsoftが改善したようです年齢推測技術最初にリリースされてからかなり時間が経ちましたが、まだやるべきことがいくつかあります。年齢はかなり近い値でしたが (年齢を 5 歳高く見積もっていた同僚は同意しないかもしれません)、表情検出の信頼性はそれほど高くないようでした。
この機能は、カメラをまっすぐ見ていない人を検出することもできません。これはかなり深刻な制限のようです。
他にも失敗はあった。チューバッカの段ボールの切り抜きは「鏡の前に立ってカメラに向かってポーズをとっている人物」と特定されたが、これは笑えるほど間違っており、奇妙なほど具体的である一方、カイロ・レンの一人は「どうやらそうであるようだ」として戻ってきた。壁でも屋内でも構いません[原文ママ]。」
もちろん、これはどれも完全に予想外のことではありません。このようなアプリを信頼できるものに近づけるには、膨大な量のトレーニング データとアルゴリズムの調整が必要です。
もっと笑うのは簡単ですが、#A失敗、現実には、この種のテクノロジーが実際に視覚障害のある人の周囲をより自信を持って移動できるようになれば、その人の人生を変える可能性があります。
しかし、Seeing AI を試して時間を費やした後、Microsoft がまだやるべきことが残っていることは明らかです。