宇宙人を探していた分散プロジェクト、SETI@homeが終了へ。分散コンピューティングは新型コロナの解析など現在進行系で活躍中

seti-at-home-screensaver

photo by alfonso.saborido via flickr(CC BY 2.0)

SETI@homeが終了へ

 SETI@home が、3月31日でいったん終了する。この話を聞いて「おおっ」と思う人は、ネットを利用する中でも、古参の部類に入るだろう。  SETI は、Search for Extra‐Terrestrial Intelligence の略である。日本語に直すと、地球外知的生命体探査計画になる。  地球の外にいる知的生命体の探査は、1960年からアメリカを中心に世界中で続けられている。表題の SETI@homeは、知的生命体の探査を、家庭のパソコンでもできるようにしたものだ。米カリフォルニア大学バークレー校が1999年から開始して、プエルトリコのアレシボ天文台の電波観測データを解析して、地球外知的生命体からの無線信号の証拠がないかを探索する。SETI@home の終了は、必要な計算をし終えたからだ。  盛時は、様々なところに、SETI@home のソフトがインストールされて、計算合戦と言える状況が繰り広げられた。元々は5~10万人の協力を見込んでいたが、数百万人を動員することになった(参照:Seti@HomeWIRED.jp)。  日本のインターネットでも、たびたび SETI@home の名前が出てきたので、見聞きした人も多くいたと思う。また、SF 的なギミックとしても、SETI@home やその概念は作品に利用されることがあった。

SETI@home、分散コンピューティング とは何なのか

 SETI@home は、分散コンピューティングをおこなうソフトウェアである。分散コンピューティングでは、ひとつの大きな仕事を、ネットワークで繋がった複数のコンピューターで処理する。  たとえば、年賀ハガキの宛名書きの仕事があったとする。書くべき宛名が1万件あったら、1人だとものすごい時間がかかる。  しかし、100人で100枚ずつ作業を分担すれば、現実的な作業量になる。さらに、500人で20枚ずつならもっと簡単だ。分散コンピューティングは、こうした仕事の分担をコンピューターでおこなう。  分散コンピューティングをおこなうには、大きな仕事を、小さな仕事に分割しなければならない。また、その小さな仕事が、他の仕事に依存しないようにしなければならない。先ほどのような宛名書きは、小さな仕事に分割するのに向いている。宛名とハガキを渡されて、それを書き写すだけでよいからだ。  小さく分けた仕事は、最終的に統合する。年賀ハガキなら、最後にまとめて郵便局に出しに行くようなものだ。計算問題ならもう少し複雑な仕事になるかもしれない。  どのように仕事を分割するか、どのように仕事を割り振るか、どう統合作業をするか、考えないといけないことは多い。分散コンピューティングをおこなうのは、なかなか大変だ。  SETI@home の例を見てみよう。SETI@home では、観測データをそのまま使うわけではない。観測から分散コンピューティングまでの流れを見ていこう(参照:SETI@homeSETI@home)。  プエルトリコのアレシボ望遠鏡で観測されたデータは、高密度テープに記録される。その量は、1日に約35GBになる。このテープは、郵便で大学に送られる。  このデータは、一定の長さの時間ごとに分割される。さらに、高速フーリエ変換により周波数帯ごとに分けられる。このデータを256分割したのが、1つの仕事の単位となる。データを受け取ったユーザーは、専用のソフトウェアで解析して結果を送り返す。  初期の頃のソフトは、SETI@home 専用だった。その後、SETI@home の運用実績をもとに開発された BOINC(Berkeley Open Infrastructure for Network Computing)に移行した。BOINC は、分散コンピューティングプロジェクトのプラットフォームだ。実際に様々なプロジェクトで利用されている(参照:BOINC)。  こうしたやり方で、巨大なデータを小分けにして解析している。

様々な分散コンピューティング

 SETI@home では、得られたデータのバックエンド分析を完了しており、今後は論文を書くことに集中するという。これまで地球外知的生命体が「存在する」という報道は成されていないので、劇的な証拠が見つかるのは難しいのかもしれない。それでも「もしかしているかも?」という情報は出てくるかもしれない。  SETI@home は休止するが、分散コンピューティングの価値がなくなったわけではない。分散コンピューティングのプロジェクトは他にも多数存在する。  たとえば「2n-1」で表されるメルセンヌ素数を発見するプロジェクト GIMPS(Great Internet Mersenne Prime Search)は、1996年に発足しており、複数の巨大素数を発見している(参照:PrimeNet)。  ここ最近では、Folding@home が注目を集めている。2000年に始まった、アメリカのスタンフォード大学を中心に行われている分散コンピューティングプロジェクトで、たんぱく質の折りたたみ構造を解析して、病気の治療に役立てるものだ。  昨今、全世界で大きな問題になっている新型コロナウイルスに対する取り組みもおこなっている(参照:Folding@homeFolding@homeITmedia NEWS)。  企業の中でも、リソースを提供しているところがある。さくらインターネットでは、さくらのクラウドの未使用リソースを活用して、新型コロナウイルス タンパク質構造解析プロジェクトに参加している(参照:さくらのクラウドニュース)。サイボウズでも、オンプレミス機材の一部を活用して参加を表明している(参照:サイボウズエンジニアのブログ)。  こうした医学への取り組みは、SETI@home でも勧められている。同サイトのトップページでは、Science United に参加して「Biology and Medicine」を選択することで、新型コロナウイルスの研究にコンピューティングパワーを提供することをユーザーに促している。  新コロナウイルスに苦しめられている昨今、こうした取り組みへの参加を、社会貢献として選択するのもひとつの手だろう。 <文/柳井政和>
やない まさかず。クロノス・クラウン合同会社の代表社員。ゲームやアプリの開発、プログラミング系技術書や記事、マンガの執筆をおこなう。2001年オンラインソフト大賞に入賞した『めもりーくりーなー』は、累計500万ダウンロード以上。2016年、第23回松本清張賞応募作『バックドア』が最終候補となり、改題した『裏切りのプログラム ハッカー探偵 鹿敷堂桂馬』にて文藝春秋から小説家デビュー。近著は新潮社『レトロゲームファクトリー』。2019年12月に Nintendo Switch で、個人で開発した『Little Bit War(リトルビットウォー)』を出した。2021年2月には、SBクリエイティブから『JavaScript[完全]入門』、4月にはエムディエヌコーポレーションから『プロフェッショナルWebプログラミング JavaScript』が出版された。