AIエンジニアの探求

計算論的神経科学で博士号取得後、AIエンジニアとして活動中。LLMの活用や脳とAIの関係などについて記事を書きます。

Biologically plausible backpropagationまとめ①

こんにちは、機械学習の研究分野の中でニッチながらも少しずつ知名度をあげてきている分野、"biologically plausible backpropagation"(日本語に直訳すると『生物学的に妥当な誤差逆伝播法』)についてこれから何回かに分けて記事を書いていきます。

初回は全体の概要的な話を書いて、次回から具体的に提案されているアルゴリズム、例えばfeedback alignmenttarget propagationなどについて詳しく紹介していきたいと思います。

誤差逆伝播法の生物学的妥当性

誤差逆伝播法は現在ニューラルネットワークを学習させる際に最も広く用いられている方法で、実際それによって深層学習は大成功を収めている。しかしこれを脳内の学習メカニズムの候補として考えると(元々ニューラルネットワークは脳にヒントを得て作られたにも関わらず)いくつかの問題に晒される。そこで誤差逆伝播法に代わるより生物学的妥当性が高い学習アルゴリズムを研究しよう。そこから脳の理解につながる可能性も出てくるし、逆に深層学習そのものの理解も深まるかもしれない。

この研究分野の概要を大雑把に説明すると上のようになります。神経科学の分野と機械学習の分野をリンクさせようというDeepmind的モチベーションで、実際DeepmindからもSynthetic gradientという手法が提案されています。


それでは具体的な「誤差逆伝播法が神経科学的に見てイケてない」点をTowards Biologically Plausible Deep Learningに沿って見ていきたいと思います。

誤差逆伝播法において誤差を出力層から隠れ層に伝える計算はすべて線形な演算だが、生体内では本来線形演算子非線形演算子の組み合わせでできているはずである。
ニューラルネットでの逆向き計算は隠れ層間のシナプス行列と隠れ層の出力の微分係数を次々と掛けていくことで行われているけど、実際の神経系でそんなに長く線形演算だけを繰り返すことなんてできるの?という疑問です。ただこれは私見になりますが、「活性化関数にReLUを使ったときは微分係数が0か1になるのでon/offの切り替えを行う非線形演算が各層で挟まれる」と主張すれば一応ディフェンスにはなる気もしています。

②脳内に存在するフィードバックパスが誤差を伝える役割を果たしているとしたら、このシナプスは書くニューロンの活性化関数の微分係数を正確に知っている必要がある。
→これは直感的にも分かりやすいんじゃないでしょうか。誤差逆伝播法みたいな精密な計算を脳内で本当に実現できるのか?というある意味素朴な疑問です。

③2のようなフィードバックパスは前向きのパスと正確に対称である必要がある。
誤差逆伝播法の計算にはシナプス行列の転置行列を使います。これはコンピュータで行う計算としては全く問題がありませんが、実際のシナプスで実装するためには行きと帰りが正確に同じである必要がでてくるわけで、それはどのように設計されたのかという問題が残ります。

④通常ニューラルネットでは決定論的な連続値を扱うが、実際の神経系では(おそらく確率的な)スパイクでやりとりがなされる。
神経科学と機械学習のギャップを埋めるためには避けては通れない話題ですが、誤差逆伝播の問題と言うよりはニューラルネット全体の課題という気もします。

⑤前向き計算と逆向き計算のそれぞれが正確に同期しながら順番に切り替わっていく必要がある(逆向き計算は順向き計算で得られたそれぞれの隠れ層の値を利用して行われる必要があるため)。
→計算の順序がどのように制御されているのか?という問題ですね。

⑥出力層における"target"(教師データ)はどこから得られるのか?
誤差逆伝播法に限らず、教師あり学習全般に関わってくる問題ですね。例えばクラス分類にしても、どのように正解ラベルを表すone-hotベクトルが神経系の中でエンコードされているかは全く自明でないと思います。

研究の意義

現在世界で唯一実現されている汎用人工知能が脳であることを考えると、その動作・学習原理を解明することは確実に大きなインパクトをもたらすはずです。そしてその解明のためのアプローチとしてニューロンレベルからそのダイナミクスを理解していこうというボトムアップ的手法に対して、biologically plausible backpropagationの研究はトップダウンなアプローチをもたらしてくれるんじゃないかという期待があります。



次回は上のリストのうち③に対応することがメインの目的であるfeedback alignmentの紹介を行う予定です。