Google翻訳が新たに110言語を追加

Google翻訳が新たに110言語を追加

  • Lamiyi
  • 0
  • rhahw
Google翻訳が新たに110言語を追加

Googleは本日、Google翻訳が新たに110言語に対応したことを発表しました。中でも注目すべきは、8,500万人以上の話者を抱える広東語の追加です。

同社は、PaLM 2 大規模言語モデルが Translate が関連性の高い言語をより効率的に学習する上で重要な役割を果たしたと述べています。

2022年には、ゼロショット機械翻訳(機械学習モデルが例文を見ることなく別の言語への翻訳を学習する)を用いて、新たに24言語を追加しました。また、世界で最も話されている1,000言語をサポートするAIモデルを構築するというコミットメントである「1,000言語イニシアチブ」を発表しました。現在、AIを活用してサポート言語の種類を拡大しています。PaLM 2大規模言語モデルのおかげで、Google翻訳に110の新しい言語が追加されます。これは過去最大の拡張となります。


Google翻訳が新たに110言語を追加

5億人以上の人々への翻訳サポート
広東語からケクチ語まで、これらの新しい言語は6億1,400万人以上の話者を抱え、世界人口の約8%に翻訳の機会を提供します。中には1億人以上の話者を抱える主要言語もあれば、先住民の小規模コミュニティで話されている言語もあります。また、ネイティブスピーカーがほとんどいないものの、活発な再活性化活動が行われている言語もいくつかあります。新しい言語の約4分の1はアフリカから来ており、フォン語、コンゴ語、ルオ語、ガ語、スワティ語、ベンダ語、ウォロフ語など、アフリカの言語の拡大としてはこれまでで最大規模となります。

Google 翻訳で新たにサポートされる言語の一部を以下に示します。

● アファール語は、ジブチ、エリトリア、エチオピアで話されている声調言語です。今回リリースされたすべての言語の中で、アファール語はボランティアによるコミュニティ貢献が最も
多かった言語です。● 広東語は長い間、Google 翻訳で最もリクエストの多い言語の 1 つです。広東語は書き言葉で北京語と重複することが多いため、データを見つけてモデルをトレーニングするのが困難です。
● マン島語はマン島のケルト語です。1974 年に最後のネイティブ スピーカーが亡くなったことでほぼ絶滅しましたが、島全体の復興運動のおかげで、現在では数千人の話者がいます。
● ンコ語は西アフリカのマンディング諸語の標準化された形式で、多くの方言を共通言語に統合しています。その独自のアルファベットは 1949 年に発明され、現在もリソースとテクノロジーを開発する活発な研究コミュニティがあります。
● パンジャーブ語(シャームキー語)は、ペルソ・アラビア文字(シャームキー文字)で表記されるパンジャーブ語の一種で、パキスタンで最も話されている言語です。
● タマジグト語(アマジグ語)は、北アフリカ全域で話されているベルベル語です。多くの方言がありますが、書き言葉は概ね相互理解可能です。ラテン文字とティフィナ文字で表記され、どちらもGoogle翻訳でサポートされています。
● トク・ピシン語は英語ベースのクレオール語で、パプアニューギニアの共通語です。英語が話せる方は、トク・ピシン語に翻訳してみてください。意味がわかるかもしれません!

詳細は下記リンクをご覧ください。

続きを読む

Google翻訳が新たに110言語を追加