カリフォルニア州ランチョ パロス ベルデス -- Microsoft の新 CEO、Satya Nadella は、同社をほぼリアルタイムの音声音声翻訳という、エキサイティングで比較的未知の領域に導いたところです。
「私たちが話し始めて以来、言語の境界を越えることは人類の夢でした」とナデラさんは語った。
関連項目:
南カリフォルニアで開催された Re/Code の第 1 回コード カンファレンス (以前は「D カンファレンス」) で講演したナデラ氏と Skype コーポレート VP のガーディープ シン ポール氏は、英語を話さないドイツ人の友人に Skype 通話を行いました。その後、Skype Translator プレベータ版のライブ翻訳機能のおかげで、双方が会話し、お互いを理解することができました。
「他にこんなことをする人はいない」とポールさんは言い、「このような試みは初めてだ」と付け加えた。そしてそれはおそらく私たちに必要なものです。
英語は世界で最も一般的に話されている言語ではありません。いくつかの推定によると、それは中国人に次いで3位(およびそのすべての変種) とヒンディー語。しかし、ますますグローバル化する社会では、言語の壁を越えてコミュニケーションをとる方法を見つけることがほぼ求められています。 Microsoft の測定によれば、Skype はすでに 3 億人を超えるアクティブなメンバーを誇り、国際通話トラフィックの約 3 分の 1 を処理しています。内蔵の音声翻訳で何ができるか想像してみてください。
Microsoft は音声認識ゲームに初めて取り組んだわけではありません。最近発売された製品にも同じテクノロジーが搭載されています。コルタナWindows Phone 8.1 のパーソナル アシスタントと、Xbox 360、そして現在は Xbox One で 1 年以上稼働している音声認識です。 Microsoft Research が開発した Skype Translator は、実際には音声認識、テキスト読み上げ、機械翻訳の 3 つのテクノロジーで構成されています。
「Skype コミュニティは大きいです。本当に大きいです」と Microsoft Research 責任者の Peter Lee 氏は Mashable へのメールで書いています。「Skype Translator を現実のものにするためには、科学を正しく理解するための優れた研究と、それを実現するための優れたエンジニアリングが必要でした」実用的で拡張性があります。」
Microsoft は Code Conference で Skye Translate をデモンストレーションします。 クレジット: Mashable、Lance Ulanoff
Skype Translator の仕組みは次のとおりです。話者 A が話し始めます。 Skype Translator は単語を認識し、実際にテキストに変換します。話者 A のテキスト トランスクリプションは話者 B の言語に翻訳され、話者 B の言語に音声合成されます。
遅いように聞こえるので、翻訳が完了するまで少し待ってくださいとポールは言いました。しかし、これは「技術的な遅延の問題」ではないと彼は主張する。このプロセスは非常に高速に進む可能性がありますが、ここにはビデオ コンポーネントがあるため、システムはすべてが自然に見えるように機能します。
Microsoft Corp VP Skype および Lync ガーディープ・シング・ポール クレジット: Mashable、Lance Ulanoff
話者 A が話している間、Skype 翻訳者が作業を開始し、翻訳された話し言葉の配信を開始しても、話者 B には実際に、より低い音量でその声が聞こえます。さらに、システムは翻訳を開始するために音声内の自然な休止、またはポール氏の説明によると「沈黙の検出」を探します。翻訳にかかる時間は、文またはフレーズの長さに完全に依存します。別の方法としては、話者が話している間ボタンを押したままにし、文やフレーズを伝えたいときにボタンを放すという方法もあったでしょう。このアプローチはより自然なはずです。
Skype 翻訳が使用する言語をどのように認識するかについては、環境設定で優先言語を設定します。今のところ、オンザフライ言語検出はありません。