このテクノロジーはリモコンに代わる可能性があります

クレジット:

Ketan Banjara さんのリビング ルームにはリモコンが散らかっていません。音楽を止めるには、彼はただ指を唇に当てます。そして、彼がソファから立ち上がって部屋を出ると、テレビ画面が自動的に一時停止します。

バンジャラはの共同創設者です予測視線は、視線検出、ジェスチャー認識、顔の特徴認識を組み合わせて、テレビから車まであらゆるものを制御するより自然な方法を作成するスタートアップです。

多くの人が初めてのタッチ スクリーン ガジェットを手に入れたばかりですが、PredictGaze はタッチフリー コントロールが次の目玉になると確信している多数の企業の 1 つです。あらゆる種類のガジェットに前面カメラが組み込まれていることから、想像するのは難しくありません。

これまでのところ、同社のソフトウェアはiOSゲームユーザーが頭を動かして、食べ物をむさぼり食べるすきっ歯のモンスターを制御できるようにします。この技術は日本の一部の店舗でもテストされており、カメラが顧客の性別、笑顔、商品の前で過ごした時間を追跡し、そのデータを躊躇する買い物客に適切なタイミングでクーポンを提供することで売上増加に活用できることを期待している。またはプロダクト プレイスメントを改善することによって。

PredictGaze は、5 歳児がテレビでアダルト コンテンツを見ないようにすることや、車のハンドルを握ったまま居眠りし始めていることを判断することなど、そのテクノロジーのあらゆる種類の応用を想像しています。

同社のテクノロジーは、機械学習アルゴリズムとコンピュータービジョンアルゴリズムをソフトウェアで組み合わせたもので、標準的な VGA カメラを使用して、ユーザーがどこを見ているか、性別、笑っているかどうかなどを把握できます。また、ジェスチャーを識別することもでき、そのすべてをデバイスが実行するアクションに変換できます。

たとえば、人の年齢を識別するために、PredictGaze はさまざまな年齢の人々の画像を使用してソフトウェアをトレーニングしました。この情報は、たとえばソフトウェアを実行している iPad に接続されたカメラの前に立ったときの画像から、年齢を特定するために使用できます。

同様に、同社は、その動作を識別するために、シャットダウン動作とシャットダウン動作以外の動作の数千枚の画像を使用してソフトウェアをトレーニングしました。

視線追跡を行うために、カメラは継続的に目の動きをキャプチャし、そのデータを使用してどこを見ているかを計算します。それは、たとえばゲーム内のキャラクターの動きに置き換えることができます。

「私たちが持っているさまざまなテクノロジーを組み合わせたわけではありません。それは違います。これは、顔、ジェスチャー、視線を処理できるテクノロジーの 1 つです」とバンジャラ氏は言います。

同社によれば、すべてのデータはリモートサーバーに送信するのではなく、ソフトウェアを実行しているデバイス上で処理され、カメラで捉えた画像は一切保存されないという。この技術は光が変化しても機能すると同社は述べている。

カリフォルニア州マウンテンビューにあるバンジャラの装飾もまばらなリビングルームで、PredictGaze チームはテレビ、ラップトップ、iPad、iPhone、iPod Touch を使った大量のデモを私に見せてくれました。

そのうちの 1 つでは、バンジャラと私は、PredictGaze ソフトウェアを実行している iPad に接続された大型フラット スクリーン テレビの前に座りました。リアーナのミュージックビデオがテレビで流れる中、バンジャーラは立ち上がって立ち去った。何も起こらなかった。私もその場から立ち去りましたが、iPad の前面カメラが誰も見ていないと判断したため、ビデオは一時停止しました。

別のデモでは、iPad を持った PredictGaze チームのメンバーが Web ページを閲覧し、視線で電子書籍のページをめくりました。

3 番目のデモでは、私たち 2 人が iPad の前に座ると、そこにいた人数、各人の性別、笑顔かどうかなどをソフトウェアが正確に判断しました。メガネをかけて髪を隠しているときでも、性別が判明する可能性があります。

現時点では、PredictGaze の取り組みの一部は繊細で気難しいものです。バンジャラと私がソファに座ったままでお互いを向いたら、リアーナも歌うのをやめました。また、PredictGaze ソフトウェアが含まれている iPhone ゲームをプレイすると、頭の動きを追跡するのに問題があるとして、ゲームが頻繁に一時停止してしまいました。しかし、少し調整して、より多くのアクションをキャプチャできる広角カメラをテレビやタブレットに組み込むことで、PredictGaze の有用性を想像できます。

同社は、アプリケーション内で使用するために、開発者にソフトウェア開発キットを販売したいと考えています。また、同社はその技術をエレクトロニクス企業に販売することも計画している。エレクトロニクス企業は、PredictGaze をデバイスに直接組み込めるように、前面カメラを備えたガジェットの販売を増やしている。最終的には、PredictGaze も独自のハードウェアを構築する可能性があります。

しかし、オンタリオ州キングストンにあるクイーンズ大学のヒューマン・コンピューター・インタラクションの准教授で同校ヒューマン・メディア・ラボ所長のロエル・バーテガール氏は、PredictGazeのテクノロジーにはそれほど感銘を受けておらず、新しいものではないと彼は言う。彼と他の人たちは、そのようなインターフェースに何年も取り組んできた、と彼は言います。

それでも、このような技術が商業的に実行可能になりつつあるのは良いことだと彼は考えている。

「この種のことには本当にニーズがあると思います」と彼は言います。

リビングルームに戻ったバンジャラさんもそう思います。