宇宙の謎を解くCERNを支援するマイクロンのテクノロジー
宇宙の謎を解くCERNを支援するマイクロンのテクノロジー
おおよそ140億年前、ビッグバンにより、宇宙、時間の存在、太陽系(地球が含まれる太陽系など)、そして最終的に生命自体がつくり出されました。
宇宙はそれ以来膨張し続けています。それに伴い、私たちはなぜ存在するのか、ビッグバンはどのように起こったのかという問いに関する人類の好奇心もふくらみ続けています。このような渇望により、銀河系屈指の物理学者が先端研究施設にこもって亜原子粒子を何度も繰り返し衝突させる実験に駆り立てられています。これらの物理学者は、衝突によって生み出されたより小さな物質 – あらゆる物質の構成要素 – を測定することにより、宇宙に関する新たな真実をかいま見ることを期待しています。
マイクロンのテクノロジーはこのような取り組みの一翼を担います。その際、次の飛躍的な進歩を熱心に追い求める物理学者に対して、最先端のディープラーニングソリューションとメモリソリューションを提供します。
このコラボレーションにより、科学を絶えず変化させる結果を生み出すことができます。
このコラボレーションの物理学的側面を担うのが、CERNと呼ばれる欧州原子核研究機構です。1954年に設立された同研究所は、世界中の素粒子物理学者の半分を擁しています。また、世界最大の粒子加速器である大型ハドロン衝突型加速器(LHC)を備えていることが最もよく知られています。LHCで実施された実験の結果、2012年にはヒッグス粒子の存在が確認されました。この「神の粒子」(主要メディアではこう呼ばれていますが、CERNに勤める知人たちはこの表現をそれほど気に入っていません)の発見は、科学コミュニティにおける画期的な事件でした。そしてその翌年、遡ること1960年代にその存在を提唱した研究者にノーベル物理学賞がもたらされました。
「CERNの研究に貢献できる機会をいただき、とても興奮しています」と、マイクロンのアドバンスト・コンピューティング・ソリューションのオペレーション担当ディレクターであるマーク・ハート氏は語ります。CERNの実験により、選別、処理、および保存を必要とする膨大な量のデータが生成されました。マイクロンは、CERNがデータに関する難題を解決する上で役に立つ複数の実験に対応したハードウェアを提供しています。
「CERNは、宇宙を理解する上で役に立つ新しいテクノロジーの応用を試みる最先端の立場にいます」と、ハート氏は述べます。「CERNとの共同作業により、当社は、信じられないほど要求の厳しい環境において新しいテクノロジーをテストできます。」
小さな衝突
CERNのLHCは、それ自体が物理学的に驚嘆すべきものです。簡単に言えば、LHCは、巨大な磁気管を通して何百万もの水素原子核を互いに向けて発射し、それらが互いに衝突したときに何が起こるかを記録します。これらの衝突により、ビッグバンの直後に似た状況がつくり出されます。CERNの素粒子物理学者、マウリツィオ・ピエリーニ氏は、これはあたかも、太陽系の一方の端から1兆個のテニスボールを高速に近い速度で発射するとともに、他方の端から1兆個のテニスボールを発射し、これらが中ほどで衝突したときに(そして衝突した場合に)何が起こるかを確認するようなものだ、と説明します。
3Dで描画したLHCの切取図
その仕組みは、次のとおりです。LHCは、フランスとスイスの国境にまたがる全長27キロメートルの地下の環状管に収容されています。水素原子から電子が取り除かれて陽子が形成され、加速器に送り込まれます。
2台の高エネルギー粒子ビームから陽子の集団が管を通してそれぞれ反対の方向に発射され、液体ヘリウムによって-271℃まで冷却された電磁石によって推進されます。この極低温環境により、電磁石が超伝導状態で動作できるため、エネルギーを損失することなく電気を伝導できます。
電磁石により、陽子は27キロメートルの環状管の中を進みます。陽子を光速に近い速度まで加速するために強力な高周波が使用され、陽子はLHCの環状管の中で毎秒約11,000回発射されます。粒子ビームは、加速器の4箇所の衝突点(LHCの4台の主要粒子検出器の設置箇所)で交差します。
また、高周波により、陽子は長さ約30cm、幅約1mmの塊となって移動します。陽子は非常に小さいため、そのほとんどは接触せずに衝突点を通過します。それでも、陽子の数は非常に多いため、毎秒最大10億回の衝突が起こります。
このデータを処理するには、膨大な計算能力が必要です。さらに科学者は早晩、正面衝突が起こる確率を高めるためにビーム強度を上げて、要求水準を高めてきます。ここで、テニスボールの例え話に戻ります。これはあたかも、テニスボールをより密着した一まとまりにすることに似ています。ボールの集団の密度を高めることにより、両方の集団が出会ったときに正面衝突する確率を高めるのです。
アップグレードしたCERNの加速器として知られる高光度LHCは、2026年頃に稼働が開始されれば、粒子ビームの強度を5倍引き上げることができます。このような技術的な要望は驚くほど大きくなります。衝突ごとに生成されるデータは1メガバイトです。現在、LHCの実験ではすでに、1秒当たり合計約1ペタバイトのデータ、すなわち2,000年間にわたって生み出された音楽作品と同等の量のデータが生成されています。
「データはより大きく、より密集し、より複雑になります」と、ピエリーニ氏は語ります。「このリアルタイム処理を行うことは非常に大きな難題です。」
データの消火ホース
ここで登場するのがMicron SB-852ボードです。512GBの最上位のDDR4 DRAMおよび2GBのハイブリッドメモリキューブを装備したこのボードは、LHCの4つの主要実験の1つである、CMSにおける機械学習の性能を高める手段としてテストされています。ニューラルネットワークの性能を集約するマイクロンのメモリソリューションは、実験用のデータ取得システムでテストされます。この実験において、CERNで働く科学者たちは、実験の計算要件とデータ処理要件をサポートできる最先端のテクノロジーを採用する方法を模索しています。膨大な量のデータを処理する上で、メモリは極めて重要な役割を果たします。これにより、研究者は、実験から得られたデータに関する貴重な見識を得ることができます。
専門用語を使わずに、「これは非常にマニア向けのボードです」と、ハート氏は語ります。SB-852ボードは、データを使用するためにビットを超高速で演算処理する能力を提供し、科学者にとって重要であるか興味深いデータはどれであるかを識別し、そうでない残りのデータを除去します。
「これらの衝突が起こったときに膨大な量のデータを受け入れることができるボード、そして、メモリを活用して内部で実行される機械学習からは、『おい、これはこれまでに見たこともないすごいことだぞ。これは注目すべき事態だ』という叫び声が聞こえてきます」と、ハート氏は語ります。
ディープラーニング
LHC内の衝突をすべて分析することは不可能です。「これらの衝突は非常に頻繁に起こり膨大であるため、データの記録システムは窒息してしまいます」と、ピエリーニ氏は語ります。
ほとんどの衝突では、すでに十分に理解された小さい粒子が生成されます。ピエリーニ氏は「秘訣は、役に立たないデータを破棄することです」と語ります。そのために、CERNでは、粒子軌道を読み、興味のないデータを捨ててしまうアルゴリズムを使用しています。
世界で最も正確な粒子衝突の予測モデルを構築したと考えられているCERNは、データを取り込み、ほんのわずかなデータを除いてすべて除去するニューラルネットワークを応用しています。これまでのところ、CERNは、見つかることが想定される亜原子粒子がどのように振る舞うのかを予想するための予測モデルを使用し、想定されるこのような振る舞いを見つけ出すためにニューラルネットワークを鍛えています。
「これは、画像内の猫と犬を見分けることに似ています。そして、ニューラルネットワークはこのような処理がとても得意なのです」と、ピエリーニ氏は述べます。
しかし、最も偉大な科学的な新発見のいくつかは、思いもよらない結果から生まれています。例えば、1964年に宇宙マイクロ波背景放射の検出によって提示されたビッグバン宇宙論の決定的な証拠があります。CERNの研究者は、興味深いデータが編集室の床に落ちたまま放置されないよう細心の注意を払っています。
したがって、CERNの研究者は、データから予想外の事象を選別できる、より高度な人工知能を必要としています。マイクロンのボードを使用すれば、予想外の結果を生み出す奇妙なデータに光を当てながら、CMSの実験においてまさにこのような選別作業を実行することが可能になります。
「当社が開発中のアルゴリズムでは、標準モデルを学習し、奇妙な事象であるために本当は確保しておくべきであったのに捨ててしまったであろう百万分の一の事象を推論により見分けることができます」と、ピエリーニ氏は語ります。
幽霊粒子の探求
素粒子物理学の研究者は、将来性があるが得体の知れないもう1つの粒子によってじらされています。その粒子とはニュートリノです。ニュートリノは電子と似ていますが、電荷がなく、質量もゼロに近く、一般物質にはめったに反応しないため、観察するのが特に困難です。マイクロンはCERNとのコラボレーションを通じて、ニュートリノを検出するために別の重要な実験に寄与しています。この実験は米国で行われ、フェルミ国立加速器研究所(Fermilab)が主導しています。
「幽霊粒子」と呼ばれるニュートリノは、最も豊富でありながら、最も小さく捉えにくい粒子の1つとして取り残されています。物理学者は、ニュートリノが存在することは知っていますが、その振る舞いについてはわずかしか理解していません。ニュートリノ研究における飛躍的な進歩により、宇宙の構造に関する科学の最も重要な問題のいくつかが解決される可能性があります。これには、ビッグバンの後に物質がどのように形成されたかの説明に寄与することも含まれます。
要するに、ニュートリノの謎を解くことができれば、私たちがなぜここにいるのかも説明できる可能性があるのです。
ニュートリノは、物理学者から標準モデルと呼ばれる、物質の構成要素について説明するモデルとつじつまが合います。ただし、ニュートリノは、ノーベル賞を受賞した最新の発見によって質量があることが証明されるまでは、質量がないと考えられていました。この発見により、幽霊粒子をよりよく理解できればほかにどのような謎を解くことができるかという疑問が生じました。
これは、物理学者にとっては胸躍る出来事です。
CERNは、地下深部ニュートリノ実験(DUNE)と呼ばれる過去最大規模のニュートリノ検出プロジェクトの立ち上げに取り組んでいる国際コンソーシアムに参加しています。この実験には、米国内で2台のニュートリノ検出器が使用される予定であり、うち1台はサウスダコタ州リードにあります。そこでは、廃棄された金鉱の立坑を使用して、作業員が80万トンの岩石を掘り出し、4万トンを超える液体アルゴンで満たされた巨大な空洞を用意します。
1,300km離れたシカゴ郊外のFermilabにある粒子発生器から検出器に向けてニュートリノのビームが地中を通って発射されます。そこで、検出器を通過するニュートリノを精密テクノロジーによって測定します。実験によって作成される画像により、ニュートリノの振る舞いに関する洞察がもたらされます。これは、ニュートリノの謎を解くためにDUNEに取り組むことを目的として、世界中の175の研究機関から参加する1,000名を超える研究者が関わる大規模なコラボレーションです。
ニュートリノの追跡
DUNEには、LHCの実験とは異なるデータ上の課題があります。LHCでの粒子衝突では、除外する必要があるデータが大量に生成されますが、ニュートリノはめったに物質と作用し合いません。つまり、DUNEの空洞検出器内でニュートリノが検出されることは極めて少なくなります。
「検出器の3Dアレイによって検出された各ニュートリノによって生成されるデータのすべてのバイトを圧縮して保存することが課題となります」と、ピエリーニ氏は語ります。必要な計算能力を実現するために手段として、CERNで構築されたこれらの検出器のプロトタイプで同じMicron SB-852ボードがテストされています。また、そのニューラルネットワークでは、ほかに何を収集できるかを解明し、減衰するニュートリノを識別しやすくするために、データの推定も行います。
「[目的は]、局地的に開始されるかもしれないが、その後は全体的に事象を観察するデータ処理アルゴリズムを開発することにあります」と、ピエリーニ氏は語ります。
2026年にDUNEの実験の稼働を開始することを目指す計画を伴い、サウスダコタ州で昨年、起工式が執り行われました。
おそらく140億年後には、ニュートリノに関するジレンマは「幽霊」という汚名を返上しているでしょう。
DUNEのニュートリノ検出器のプロトタイプ
理想的な提携
マイクロンとの提携は、CERNによるコラボレーションの誇り高き伝統にとって不可欠です。
CERNは、オープンデータポータルを介して実験データを共有しています。現在、研究者は必要に応じて、データセット、ソフトウェア、環境、および学術的文書に含まれる1ペタバイトを超える情報にアクセスし、これらを使用できます。CERNは、データをできるだけ広く拡散できるようシステムを構築することにより、オープンソースデータおよびソフトウェアに専念しています。
同様の倫理を念頭に置いて、CERNは、CERNオープンラボと呼ばれる官民連携プラットフォームを介してその他の業界トップクラスの研究機関やテクノロジー企業と協力しています。
「CERNは、公共部門と民間部門の両方と公然と協力しています。また、マイクロンのようなテクノロジーパートナーと提携することにより、研究コミュニティのメンバーは、革新的な業務を遂行するために必要となる高度なコンピューティングテクノロジーにアクセスしやすくなります」と、CERNオープンラボのCTOであるマリア・ジローネ氏は述べます。
「CERNとのコラボレーションには、科学分野や成長し続けるテクノロジーコミュニティにおいて増大するメモリの重要性が反映されています」と、ハート氏は述べます。
「振り返って見ると、メモリはいつもあとからの思いつきでした。サーバーとプロセッサーが最も重要な要素でした」と、ハート氏は語ります。「今では、サーバーがクロックスピードの壁に阻まれていることに誰もが気付いています。現在、これらすべてのアプリケーションの命運はメモリが握っています。」