Apple、Google、Amazon、各社投入の音声UI、あれは「誰が聞いている」?

質の向上に必要な音声資源

 こうした人手による確認は、言葉の世界では必要だと考えられる。  私は小説を書いていて、その文章をプログラムで解析して質の向上を目指す試みをしている。そのため研究者ではないが、言語関係の資料を見ることがある。そうした際によく出てくる言葉にコーパスというものがある。データベース化された言語研究のための資料だ。テキストベースの書き言葉や、音声ベースの話し言葉。そうした分類だけでなく、どういった文脈で使われているかで、様々な資源が存在している。  国立国語研究所のコーパスのページや、音声資源コンソーシアムのコーパスリストのページを見ると、様々な資源があることが分かる。  たとえば同じ書き言葉でも、新聞に出てくるものと、ツイッターでつぶやいているものでは、出てくる単語や用法が違う。話し言葉でも、朗読している内容と、家庭内での会話は大きく異なる。  用途に合わせたデータを元に学習しなければ、質の向上は望めない。それらの情報を効率よく収集するには、実際に現場で利用されている音声を使えばいい。  言葉は、日々新しい単語が生まれる。時代の変化により、同じ単語でも文脈が変わる。音声アシスタントを提供する各社が、生のデータを得て活用しているのは理解できる

プライバシーは時代によって変わる?

 音声アシスタントによる会話の録音と第三者による確認は、プライバシーを侵しているのだろうか。  防犯カメラなどの監視カメラが、街に普及した時期、プライバシーについての議論が多く交わされた。現在は、街中にあるカメラを非難する人はあまり見ない。  昭和の頃、地域によっては扉に鍵を掛けず、隣人が気軽に入って来るのが当たり前だった。江戸時代の長屋は、現代的なプライバシーとは無縁の場所だっただろう。  プライバシーという概念自体、1960年代後半になって合衆国最高裁判所により憲法上の一つの独自の権利として認められたものだ(参照:コトバンク)。概念としては比較的新しく、そしてカバーする領域は相対的なものだ。  音声アシスタントは、家庭や寝室といった他人を排除した空間の情報も外部に送る。それを防ぎたければ、使用を止めたり、録音を停止することもできる。音声を外部に送るかは、その仕組みを知ってさえいれば自身で選ぶことができる。  しかし知らなければ、一部とはいえ会話が外部に送られ、他人が聞いていることに気付かないまま生活することになる。知らない間に、こうしたことがおこなわれることを、人々は許容できるだろうか。あるいは利便性を優先して無視するかもしれない。  時代によって、その許容範囲は変わる可能性がある。ただ、他人が聞いているかどうかという情報は、音声アシスタントを提供する各社は、もっと積極的に開示するべきだろう。それこそ、その都度確認をとってもよいのではないかとさえ思う。
やない まさかず。クロノス・クラウン合同会社の代表社員。ゲームやアプリの開発、プログラミング系技術書や記事、マンガの執筆をおこなう。2001年オンラインソフト大賞に入賞した『めもりーくりーなー』は、累計500万ダウンロード以上。2016年、第23回松本清張賞応募作『バックドア』が最終候補となり、改題した『裏切りのプログラム ハッカー探偵 鹿敷堂桂馬』にて文藝春秋から小説家デビュー。近著は新潮社『レトロゲームファクトリー』。2019年12月に Nintendo Switch で、個人で開発した『Little Bit War(リトルビットウォー)』を出した。
1
2
PC_middleRec_left
PC_middleRec_right
関連記事
PC_fotterRec_left
PC_foterRec_right