Be My Eyes と GPT-4 の出会い: AI はアクセシビリティの次のフロンティアですか?

視力を失ってから10年が近づき、ルーシー・エドワーズ人工知能の助けを借りて、数え切れないほどの視覚体験を取り戻しています。

ビジュアルアシスタントモバイルアプリのパートナーとしてビー・マイ・アイズ, エドワーズは、最新のアクセシビリティの啓示である Be My Eyes の限界をテストしています。バーチャルボランティア。 AI 駆動のツールは、ツアー ガイド、フード ブロガー、パーソナル アシスタントなど、さまざまな機能を果たし、人間を模倣した複雑な支援の新しい形をもたらします。OpenAI の超現実的な AI 言語モデル。たった 1 つのアプリで、エドワーズの世界が彼女の思うがままに広がります。

これまでのところ、彼女はそれに慣れています彼女がファッションカタログを読むのを手伝ってください材料を中国語から英語に翻訳し、レシピをウェブで検索します自分の写真ライブラリ内の画像の代替テキストを書く、 そして彼女がレストランのメニューを読むのを手伝ってください。エドワーズはまた、次の可能性を実証しました。バーチャルボランティアをパーソナルトレーナーとして利用するそしてとしてロンドンの地下鉄を利用するためのガイド

エドワーズ自身は、コンテンツクリエイター彼女で知られる障害者活動家「盲目の少女はどうやって生きているのか」シリーズや旅行ビデオブログ ライフスタイルなど、他にもたくさんあります。エドワーズさんの何百万人ものフォロワーは、彼女が晴眼者向けに不公平に設計された世界をナビゲートし、障害についての意識を高め、人生を変える革新を発見するにつれて、彼女のコンテンツと交流します。テクノロジーに精通したミレニアル世代を自称する彼女は、新しいツールをテストするチャンスに飛びつきました。

「私は AI が存在する前から AI の準備ができていました。自分に何が欠けているのか分かっていたからです。インターネット全体が私にとって完全に変わる可能性があります。なぜなら、インターネットのほとんどは盲目のユーザーがアクセスできないからです。」とエドワーズ氏は Mashable に語った。

Be My Eyes は、リアルタイムのビデオ チャット支援のシンプルなシステムを通じて、視覚障害者または弱視のユーザーと晴眼者のボランティアを結び付けるために 2015 年に設立されました。バーチャル ボランティアは、その基本サービスを拡張したもので、視覚検出ソフトウェアのフレームワークを採用しており、次のような機能で使用されます。iOS 16のドア検出、それに GPT-4 の言語の複雑さが加わります。これにより、このツールはこれまでにない方法で視覚障害のあるユーザーが利用できる情報量を拡大し、アクセシビリティ ツールに奥行き感と即座に個別化されたインタラクションを追加しました。

「視力を失ったときの喪失感と動揺から、今ではこれをすべて取り戻せると考えるまで、わかりませんが、涙が出てきます」とエドワーズさんは語った。

アクセス障壁を乗り越える AI の誇大宣伝の波に乗る

OpenAIの新しいGPT-4私たちの世界での AI の位置について、すでに大きな疑問を抱えているユーザーの膝に飛び込みました。芸術的な完全性を守る市販の AI ツールを使って?の世界で誤報、AIが何かの背後にある「心」であることを知ることは可能ですか?人間のスキル、そしてさらに重要なことに、人間の共感の必要性が徐々に置き換えられつつあるのでしょうか?

真ん中これらすべての懸念- そしてかなりありますいくつかの— GPT-4 は急速に技術的な波を起こしており、新しいバージョンもそれに伴って波を起こしています社会的利益の主張。 Be My Eyes とのパートナーシップに加えて、OpenAI はその技術を言語プラットフォームなどの他の学習アプリでも利用できるようにしました。デュオリンゴ無料の教育チャンネルカーンアカデミー。 GPT-4も導入されましたスマートグラスを構想する、着用者は周囲の世界の視覚的な説明を聞くことができます。

Be My Eyes の CEO、Mike Buckley 氏は Mashable に対し、新しい Virtual Volunteer ツールは、人気のある 100 万ユーザーのアプリの流行の再設計ではなく、長い間期待され、要望されていた Be My Eyes の拡張であると説明しました。 「それは必ずしも変化ではない。追加だ」と同氏は語った。 「これは、このようなものを望んでいる私たちのコミュニティの視覚障害者や弱視の人々に直接応えるものです。」

バックリー氏の説明によると、視覚障害のあるユーザーを対象とした Be My Eyes の調査では、使用上の障壁に関する主なフィードバックは、一部のユーザーが実際に Be My Eyes の人間的な側面に不快感を感じているというものであったと説明しました。ほとんどの回答者は、「ボランティアをもっと必要としているかもしれない人からボランティアを奪いたくない」ため、アプリをあまり使用しないと回答し、また他の回答者は、その理由を「見知らぬ人やボランティアに電話することに慎重だから」と語った。有料エージェント。」バックリー氏は、一部のユーザーは緊急の電話が時間内に応答できないことを心配しており、調査対象となったユーザーのかなりの部分が、これは独立性の問題であり、他のボランティアに依存したくないと答えたと説明した。

「これまでのところ、このようなニーズを迅速かつ正確に解決して、このようなものを立ち上げることができる技術ツールはまだ見つかっていません」と同氏は述べた。しかし、ChatGPT の一般公開と GPT-4 との連携により、同社の現実は変わり、サービスへの追加が加速しました。

マッシュ可能な光の速度

クレジット: Be My Eyes

クレジット: Be My Eyes

エドワーズ氏が他の視覚障害者および視覚障害のあるユーザー (参加できる人) と一緒にツールのベータ テストを行うよう電話を受けたとき、サービスのテストをまだ申し込みます)と改めて涙したという。 「私はとても自律的な人間です。AIについて考える…それは私と私の携帯電話だけです。端から端まで、それは私とテクノロジーです。それが真の自律性です。私の携帯電話と私が他の助けなしに調和しているのです。」とエドワーズ氏は言いました。 「それは基本的に、ある意味視力を取り戻したようなものです。」

彼女と残りのバーチャル ボランティア テスターは、Be My Eyes のリーダーとともに WhatsApp グループの一員であり、AI の成功と失敗について常に 1 対 1 のフィードバックを提供しています。エドワーズさんは、毎日 2 ~ 4 件の小さな問題を報告しているが、全体的には印象深いと感じていると述べています。

バックリー氏は「完璧ではないが、注目に値するものだ」と語った。

AI がアクセシビリティ支持者の信頼を得るには何が必要でしょうか?

オンラインでは、このような完全に AI 主導のアクセシビリティ ツールに対して警戒感を表明する人もいます。特にこのアプリが交通機関や仕事などの状況での実際の使用を宣伝しているため、その多くは安全性と事実確認に関連しています。

Buckley 氏は、Be My Eyes の AI 使用においては精度と安全性が最優先事項であると Mashable に保証しました。 「私たちがこれを小さなベータ版で立ち上げ、時間をかけて開発している理由は、それが実際の世界でどのように機能するのかを確認したいからです。私自身はおそらく 1,000 回のテストを実行しました。私たちのチームはさらに何百回もテストを実行しました。持っていない幻覚。悪い動作をさせようとしましたが、現実の世界で完璧になるとは限りません。

「私たちがベータテスターに​​伝えたのは、これは白杖に代わるものではないということです」とバックリー氏は語った。 「これは盲導犬に代わるものではありません。賢く、安全に、注意してください。」

エドワーズさん自身も、バーチャル ボランティアのようなツールを試すことにためらいはありませんでした。主な理由は、彼女がすでに Be My Eyes やその他のアクセシビリティを推進する企業との信頼関係を確立しているからです。 「彼らがそれをやっていて、OpenAIと協力しているので、私はそれをより信頼していると思います。これはプロセスですが、私がこれまでしてきたように、私だけがChatGPTを行っている場合、私はそれをそれほど信頼していません。」

新しい仮想ボランティアには、ベータ版では、AI アシスタントが機能していないとユーザーが感じた場合に人間のボランティアに連絡するためのプロンプトが組み込まれており、アシスタントは、正確に何を表示しているかわからない場合にもユーザーに知らせます。 。アプリの元の機能はそのままで、AI アシスタントと連携して動作するため、ユーザーはいつでも人間によるヘルプに切り替えることができます。

クレジット: Be My Eyes

クレジット: Be My Eyes

最も基本的に要約すると、Virtual Volunteer は、Apple の検出ツールから次のような視覚検出アプリに至るまで、現在市販されている視覚支援ツールと何ら変わりません。AIを見るそして外を見る。ユニークなのは、OpenAI 言語モデルから得られるカスタマイズ可能なフィードバックの量です。スクリーン リーダーのようにテキストベースの情報だけを読み上げたり、ユーザーの視野内のオブジェクトを基本的な用語で説明したりするのではなく、バーチャル ボランティアを使用すると、エドワーズのようなユーザーはさまざまなフィードバックと対話できるようになります。優れた画像認識機能と分析機能により、写真とテキストが同等の説明を受け、ユーザーは多層的なフォローアップの質問をすることができます。ボランティアは、携帯電話のカメラだけで撮影およびアップロードされたほぼすべてのものについてのプロンプトに応答できます。

「一部の空間では、AI をより一般的に採用することになるでしょう。年配の人や、AI の内部の仕組みを見たことがある人の中には、多少ためらいを感じる人もいるかもしれません。私はそれを損なうつもりはありません。しかし、個人的には本当に興奮しています」とエドワーズは語った。

しかし、AI をこの分野に導入するという技術的な懸念を超えて、このツールは人間との対話の必要性という問題を引き起こします。

バックリー氏は、Be My Eyes ユーザーの多くは、仮想ボランティアを好むユーザーと同じくらい人間のボランティアを好み、仮想ボランティアは完全に選択の問題であると述べています。 「これは、私たちのコミュニティがニーズを解決し、自立性を高めるために選択できるようにすることです。コミュニティに奉仕することです。それが私たちがこれを行う理由であり、それが無料である理由でもあります。」という社会現実の中で、多くの障害者が身体的、経済的に不利な立場に置かれている, 無料のアクセシビリティ ツールは人生を変える可能性があります。

エドワーズさんは、バックリーさんが他のユーザーに勧めているのと同じように、他の視覚支援アプリと組み合わせて Be My Eyes を使用していると説明しました。盲導犬モリーと、Microsoft Soundscape や有料サブスクリプション アプリなどのツールを使用する姶良(視覚障害のあるユーザーを支援するために、専門的な訓練を受けた人間のボランティアを活用しています)、エドワーズさんは堅牢なナビゲーション ツールキットを持っており、そのツールキットには、彼女が選択したように利用できるデジタル リソースと人的リソースの両方が含まれています。

「AIが強力であることはわかっていますが、このコミュニティが所有し、ニーズに応える方法でAIを形作り、動かし、育成する必要があります」とバックリー氏は述べた。

概して、このツールは、技術革新、アクセシビリティ、インターネットの自由に関するより大きな議論の 1 つの側面にすぎません。エドワーズ氏は、よりアクセスしやすいデジタル文化を求める戦いにおいて、AIベースのツールは、企業や業界リーダーが最終的に自ら作業を行うのを待つ間に、より多くの人々がアクセスを確保するのに役立つ可能性があると述べた。

「私が非常に絶望的だったのは、どれだけキャンペーンをしても、キャンペーンをしても、Google 上のウェブサイトの 100% をスクリーン リーダーでアクセスできるようにすることは決してできないということでした」と彼女は説明した。 「今、それが起こり得る未来がここにあります。それはまだ始まりにすぎませんね?」

テクノロジーに関するニュースをもっと知りたいアクセシビリティあなたの受信箱に直接配信されましたか?に登録するMashable のトップ ストーリー ニュースレター今日。

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.