私は、Google 所有のビデオ Web サイトが招集した記者会見のため、カリフォルニア州サンブルーノにある YouTube 本社に来ています。国連の会議を思わせる部屋で、YouTube、Google、スタンフォード、バークレー、カリフォルニア聾学校 (CSD) の講演者グループが YouTube とアクセシビリティについて講演しようとしています。
Google の音声テクノロジー チームの一員であるマイク コーエン氏 (注: 彼も聴覚障害者です) は、最初に手話を使ってチームのビデオに関する取り組みについて話しました。この記者会見は YouTube と障害者、特に聴覚障害者へのアクセシビリティに関するものです。これは、今日誰でも利用できるようになった YouTube の新しい自動キャプション技術に関するものでもあります。
以下は、今日の記者会見での私のライブメモです。
詳細
自動キャプション機能は、昨年 11 月に限定ベータ版としてリリースされました。これは、選ばれたパートナーがシステムをテストするためのもので、Googleのアルゴリズムがビデオ内の単語を解析し、それをキャプション(Nexus OneとAndroidで使用されている技術である音声テキスト変換)に変換するものだった。
- コーエン氏は、Google I/O 2009 での Google CEO エリック・シュミットの基調講演のビデオを使って新しいテクノロジーについて語り、デモを行いました。英語の自動キャプションは非常に効果的でした。
- 次に、フランス語の音声認識翻訳をオンにしました。自動キャプションは英語でのみサポートされていますが、複数の言語でキャプションを表示できます。
- こんな感じです。さらに下にスクロールすると、自動キャプション技術を使用したビデオが表示されます。
- 現在、Google 音声技術チームは、自動字幕起こしを運用するために直面した課題について話しています。彼らのビジョンは、すべてのビデオにすべての言語で正確なキャプションを作成することでしたが、膨大な語彙、背景雑音、貧弱な録音、アクセントのばらつき、歌と音声の区別に対処する必要がありました。
- Google のアプローチは、キャプションを大規模に迅速に反復およびモデル化できる機能を備えているため、クラウドからキャプションを配信することです。
Google の自動キャプションの仕組み
- 現在、Google のナオミ ビロドー氏が自動キャプションの立ち上げについて講演しています。
- 彼女は、自動キャプションは単に YouTube コンテンツ クリエイターがより多くの視聴者にリーチできるようにするだけなので、彼らにとっては明らかなメリットであると述べています。
- キャプションを付けることができるのは自分のビデオのみです。他の人のビデオにキャプションを付けることはできません。
- Bilodeau さんは現在、キャプション インターフェイスのデモを行っています。タイムスタンプ付きの完全なキャプション ファイルを表示したり、テキスト ドキュメントとしてダウンロードしたりすることもできます。独自のキャプションを独自のトラックとしてアップロードすることもできます。自動キャプションが機能しない場合や、自動キャプションのテキストを編集する場合に便利です。
- キャプションの作成には時間がかかります。ビデオの長さに応じて 1 日または数日かかります。
教育
- 現在、YouTube のコンテンツ パートナーシップ チーム (特に YouTube EDU) で働いている Obadiah Greenberg 氏。
- 大学 (スタンフォード、バークレー、UCLA、MIT、デューク大学、イェール大学、コロンビア大学、ニューサウスウェールズ大学) およびいくつかのメディア出版物 (デマンド メディア、PBS、ナショナル ジオグラフィック、UCTV) は、自動キャプションの最初のパートナーでした。 。
- 現在、カリフォルニア大学バークレー校のウェブキャストに取り組んでいるベン ハバード氏は、Google と YouTube を通じて講義やコンテンツのリーチを拡大し、自動字幕起こしプロジェクトに参加できることに興奮していると話しています。
- 新しい講演者: スタンフォード オンライン アクセシビリティ プログラムを運営する John Foliot 氏。彼はウェブビデオの台頭について話しています。ビデオをより多くの人に届けるために彼が感じた最大の課題の 1 つは、単純に、教授やビデオ作成者が非常に忙しく、長いビデオを見て特定のコンテンツを見つける時間がないという事実です。自動キャプションを使用すると、こうしたユーザーはテキストベースの検索を使用するだけで必要なものを見つけることができます。
- マイク・コーエンがステージに戻ってきました。彼は検索における自動キャプションの使用について話しています。検索でクローズドキャプション付きのビデオのみを表示するように指定できます (検索に CC アイコンが表示されます)。以前、彼がMITにいたとき、手話通訳者がいなかったため、講義を理解することができなかった。今ではキャプションを使用して、見逃した講義を視聴できるようになりました。
- ビロドー女史は今度は手話で話します(彼女は聴覚障害者ではありません)。カリフォルニア聾学校の数人のメンバーを紹介します。彼女はこのビデオを披露しました (自動キャプションが有効になっています。オプションを表示するには右下のボタンをクリックしてください)
- 現在、カリフォルニア聾学校の生徒たちは、ウェブビデオという主要な現象から自分たちがもう排除されていないと感じていること、そしてこのテクノロジーを構築してくれた Google に感謝していることを(手話で)話しています。
- 同校のジョーイ・ベアさんは、将来的にはサインを自動的にテキストに変換するシステムができることを期待している。それは素晴らしいことですが、間違いなくさらに複雑に思えます。画像認識はまだ初期段階にあります。