クレジット:
新しい研究は、あまり一般的ではない言語がインターネットから消滅する危険にさらされていると警告しています。
アイスランド語、ラトビア語、リトアニア語、マルタ語などの言語は、足場を築くには話者が少なすぎますし、翻訳エンジンを動かすにはオンラインの例が少なすぎます。これらはデジタル絶滅のリスクが最も高い言語の一つですが、英語以外に安全な言語はありません。オランダ人、フランス人、ドイツ人、イタリア人、スペイン人でさえ、ますます高度化する技術を推進するリソースに関しては、「適度な支援」以上のものではないことが示された。音声からテキストへおよび音声制御デバイス。
この研究「デジタル時代のヨーロッパの言語」は、ヨーロッパで話されている 80 言語のうち少なくとも 30 言語を将来にわたって使用できるようにすることを目的としたヨーロッパの非営利団体 META-NET によって実施されました。 META-NET は 9 月 26 日を「ヨーロッパ言語の日」と定めています。
研究者らは、スペルチェッカーや文法チェッカー、仮想パーソナルアシスタントなどの言語技術ソフトウェアを評価しました。シリiPhone、Google 翻訳などのオンライン翻訳機、カーナビゲーション システムを使用して、言語がデジタルでどの程度表現されているかを確認します。
言語は多くの場合、新しい文を以前の何千もの文と比較することによって自動的に翻訳されます。翻訳された人々によって収集され、データベースに保存されます。一致が良好であればあるほど、結果はより正確になります。しかし、サンプルデータのプールが小さい言語の場合、統計的手法は失敗する運命にあると研究は述べている。
「『大きな』言語と『小さい』言語の間の格差は依然として広がり続けている」と研究の共同編集者のゲオルグ・レーム氏は声明で述べた。 「私たちは、すべての小規模でリソースが不足している言語に必要な基本テクノロジーを確実に装備する必要があります。そうしないと、これらの言語はデジタルで消滅する運命にあります。」
META-NETは、言語が情報の流れを妨げない単一のデジタル市場を確立するには、欧州言語間の技術格差を克服する必要があると述べている。しかし、その障壁は非常に大きい、と彼らは言う。ほとんどの研究開発において英語に重点が置かれていることが、大きなハードルの 1 つとなっています。さらに、ヨーロッパ最古の言語は、テクノロジー企業側の固有の困難、関心の低さ、資金不足によって危機にさらされています。