- LLMは膨大なデータで訓練されるのに、人間の知能の一部にも達していない。その理由は、脳が使用する損失関数(loss function)の設計にあるという仮説を展開する回。
- 進化が時間をかけて洗練した複雑な損失関数と学習カリキュラムが、シンプルな次トークン予測で最適化したAIにはない、という視点が核になっている。
- 後半では科学全体のインフラ不足を『ギャップマップ』の概念で整理し、脳解明だけでなく、数学検証言語など多分野での技術的投資の必要性を指摘する。
論点をもう少し詳しく読む
脳とLLMの能力ギャップ——損失関数と学習カリキュラムの差異
Marblestoneは、脳とAIの根本的な違いは、訓練データ量ではなく、学習の目標(損失関数)の複雑さにあると主張する。現代の機械学習は「次トークン予測」や「画像分類」といったシンプルな目的で最適化されているのに対し、進化は何百万年かけて多様で段階的に変化する損失関数を脳に組み込んだ、という見方。さらに異なる脳領域が異なる時期に異なる目標を学ぶ、まさに『Pythonコードで書かれたカリキュラム』のような仕組みを進化が実装した可能性を示唆する。これは機械学習の数学的単純さへの執着が、脳の学習メカニズムを見落としている可能性を指摘する重要な議論。
大脳皮質の『全方向推論』——次トークン予測との根本的な違い
脳(特に大脳皮質)は単なる予測エンジンではなく、『全方向的推論』(omnidirectional inference)を行うという仮説を展開する。つまり、任意の変数の部分集合から別の部分集合を予測できる柔軟性を持つのに対し、LLMは文脈ウィンドウ内の全情報から特定の条件付き確率(次トークン)を計算する、より制約された操作をしている。この根本的な違いが、脳が少量のデータで多様な課題に適応できる理由かもしれないというMarblestoneの指摘は、現在のスケーリング戦略の限界を示唆している。
細胞レベルのメカニズム——本質的な計算か、実装上の複雑さか
デジタルコンピュータでは重み付けパラメータの変更は簡単だが、生物細胞では核や分子機械を通じて複雑な信号伝達が必要になる。Marblestoneは、神経細胞の多くの細胞内活動はシナプス間の接続変化を支援するための『配管工事』に過ぎず、アルゴリズムレベルでは新しい計算を追加していない可能性を示唆する。ただし小脳の時間遅延学習など、細胞体が機能的な役割を果たしている例も存在することを認めつつ、一般的な学習メカニズムはシナプス接続の変化が主軸だという立場を保持している。
科学全体のインフラギャップ——『基本的能力マップ』と投資の必要性
番組後半ではMarblestoneと対話者が、科学全体に共通する技術的インフラの不足を議論する。Convergent Researchが作成した『ギャップマップ』によると、物理、生物、数学など各分野で数百の基礎的課題が存在し、それぞれがディープテック企業規模のプロジェクトに相当する。驚くべきことに、数学証明までがLean(検証可能なプログラミング言語)などの専用インフラを必要とすることが明らかになった。つまり、脳研究に限らず、現代科学全体がGPUやPyTorchのような『スケール可能なインフラ』を各分野で必要としており、これが根本的なボトルネックになっているというMarblestoneの診断は、科学投資の方向性に大きな示唆を与える。