何気なく利用する「クラウド翻訳」のリスク。Firefoxのオフライン型翻訳機能実装計画から考える

翻訳とは「情報を提供すること」でもある

 ネット上には、様々な翻訳サイトがある。現在、最も利用されているのは、おそらく「Google 翻訳」ではないだろうか。直接利用していなくても、Google のサービスを使うことで、知らず知らずのうちに恩恵をこうむっている可能性がある。 「Google 翻訳」を利用していると、クラウドを利用した翻訳の危うさを感じる瞬間がある。何度か経験したことがあるのだが、文書を翻訳している時に、代名詞「We」のいくつかが「Google」という単語に翻訳された。  これは、機械翻訳の学習に、Google が作成したドキュメント(おそらくユーザーサポートなどの文章)を利用しており、それに似た文章を翻訳する際に「We」を「Google」に置き換えたのだ。  この「We」が他の単語になることも当然起こりうるだろう。文章を翻訳した際に、「I」や「We」や「That」が、特定の名前になる可能性はある。それが、暴露されては困るフレーズのこともあるかもしれない。 「Google 翻訳」では「情報の修正を提案」という機能があり、翻訳結果の改善を利用者から募っている。また翻訳結果にスターを付ける機能も備わっている。それはつまり、ユーザーが送ったデータを、さらなる改善のために利用しているということだ。そのデータが、どこで使われるかは分からない。クラウドを利用した翻訳は、そうしたリスクを承知の上で使わなければならない

ネット経由の翻訳を振り返る

 ネットを利用した翻訳の危うさについて書いた。しかし、便利であることもよく分かっている。実際に筆者も、昔からよく利用している。翻訳サイトでざっと流し読みしたあと、本文を読むと短時間で読めるので便利だ。最近の翻訳精度なら、原文をイメージしながら訳文を読むこともできる。  現在は「Google 翻訳」を利用しているが、その前はエキサイト 翻訳を利用していた。一時期は「Webの翻訳と言えば『エキサイト 翻訳』」という感じだったが、いつの間にか「Google 翻訳」を使う頻度が多くなり、気付くと「Google 翻訳」に完全にシフトしていた。 「エキサイト 翻訳」は、2000年に開始された(参照:エキサイト株式会社)。「Google 翻訳」は2006年開始である(参照:Google AI Blog)。それ以前はどうだったかと考えて、そういえば AltaVista(アルタビスタ)に翻訳機能があったなと思い出した。  AltaVista という名前を覚えている人は、かなり古参のインターネットユーザーだと思う。DEC の研究所から出てきたアメリカの検索エンジンだ。そこに複数言語の翻訳ができる「Babel Fish」というサービスが存在していた。登場は1997年と古い(参照:Internet Watch)。日本語に対応したのは2001年と、「エキサイト 翻訳」よりは遅い(参照:Internet Watch)。 「Babel Fish」の機械翻訳の技術は、SYSTRAN 社のものを利用している。同社は1968年に設立された。冷戦時代、機械翻訳は、ロシア語を英語に翻訳するという需要があった。ある意味、軍事技術の民間への応用と言える。 「Babel Fish」を提供していた AltaVista は、紆余曲折を経たあと、2003年にオーバーチュアに買収された。そのオーバーチュアは、2004年に Yahoo! に買収された。そして、マリッサ・メイヤーの手により、AltaVista は2013年に閉鎖された(参照:ASCII.jp)。ネット経由の翻訳ということで、 AltaVista のことを思い出したので少し書いてみた。
次のページ 
クラウド時代のプライベートとセキュリティ
1
2
3