導(dǎo)語(yǔ)
為什么人腦僅占2%的體重,卻消耗了人體20%的能量?人腦與計(jì)算機(jī)之間誰(shuí)的能耗更高?大腦的代謝模式怎樣啟發(fā)計(jì)算機(jī)與人工智能設(shè)計(jì)?最近的研究發(fā)現(xiàn),大腦在處理計(jì)算與通信兩種任務(wù)時(shí),代謝模式不同,且大腦通信的代謝成本遠(yuǎn)高于計(jì)算。大腦能耗研究也為下一代高性能低功耗計(jì)算機(jī)的研發(fā)提供了啟示。
研究領(lǐng)域:大腦能量消耗,最優(yōu)計(jì)算,神經(jīng)計(jì)算,信息處理
1. 大腦能量消耗之謎
人腦僅占體重的 2%,卻占人體代謝負(fù)荷的 20% [1-3],單位質(zhì)量的代謝成本是肌肉的10倍。另一方面,大腦能在大約 20 W 的能量預(yù)算下創(chuàng)作詩(shī)歌、藝術(shù)以及設(shè)計(jì)航天器——考慮到用來寫作這篇文章的計(jì)算機(jī)就需要 80 W 的能耗,大腦的能耗簡(jiǎn)直微不足道。
大腦中何處消耗能量,能量被用來做什么?為什么大腦的代謝成本相對(duì)于其她生命活動(dòng)如此高昂?大腦又是如何實(shí)現(xiàn)遠(yuǎn)高于硅基產(chǎn)品的能量效率?
許多經(jīng)典論文都研究過這些問題。Attwell 和 Laughlin [4] 進(jìn)行了詳細(xì)的生物物理估計(jì),表明神經(jīng)信號(hào)傳導(dǎo)和神經(jīng)遞質(zhì)釋放的突觸后效應(yīng)合起來占大腦三磷酸腺苷(ATP,生物體最直接的能量來源)消耗的 80%,這一結(jié)論也得到了神經(jīng)生理學(xué)和解剖學(xué)的支持 [5, 6]。
許多研究探討了這種能量消耗的結(jié)構(gòu)及功能后果,包括限制大腦尺寸和縮放規(guī)律(size and scaling)、有效連線模式、模擬(分級(jí)電位)與數(shù)字(尖峰)信號(hào)、分布式神經(jīng)代碼、沿神經(jīng)束的信息流量分布及其規(guī)模分布,還有計(jì)算異質(zhì)性和效率等[8-17]。Sterling 和 Laughlin [18] 對(duì)這些想法進(jìn)行綜合,得出一系列大腦的設(shè)計(jì)原則。Levy 和 Calvert [19] 提出了哺乳動(dòng)物大腦功率預(yù)算的功能解釋,表明通信的代謝成本比計(jì)算高得多,并探索了神經(jīng)回路組織的功能后果。
2. 大腦中的通信和計(jì)算
Levy 和 Calvert [19] 以早期文獻(xiàn)為基礎(chǔ),主要關(guān)注人腦中不同信息處理模式的相對(duì)能耗,而不是細(xì)胞層面不同功能的能耗。她們對(duì)通信和計(jì)算做出了關(guān)鍵的區(qū)分:“通信”一般是指信息點(diǎn)到點(diǎn)的傳輸(可能以某種方式編碼),不包括表征轉(zhuǎn)換、特征提取或決策的映射。大腦中通信的一個(gè)例子是視覺信息沿視神經(jīng)從眼睛到中央大腦的傳輸,這個(gè)過程中視覺信息保持不變。“計(jì)算”是一個(gè)更微妙的概念,通常從輸入-輸出轉(zhuǎn)換的角度來理解。
Levy 和 Calvert 在先前工作的基礎(chǔ)上,將每個(gè)神經(jīng)元視為對(duì)自身輸入中的潛在變量進(jìn)行“微觀估計(jì)或預(yù)測(cè)”,并在脈沖間隔內(nèi)(神經(jīng)元兩次傳輸信號(hào)的動(dòng)作電位之間)對(duì)輸出進(jìn)行編碼。微觀估計(jì)和預(yù)測(cè)是極其一般化的框架,能夠包含神經(jīng)計(jì)算的其他觀點(diǎn)(如將神經(jīng)元視為動(dòng)力系統(tǒng)或邏輯門),并且還包含了單個(gè)神經(jīng)元在神經(jīng)網(wǎng)絡(luò)中的計(jì)算功能。同樣,脈沖間隔中信息編碼的形式也包含多種可能性,如速率編碼和模式編碼。因此,大腦中神經(jīng)元“計(jì)算”的一個(gè)例子可以是 V1 區(qū)(見圖1) 中的一個(gè)細(xì)胞對(duì)視神經(jīng)輸入信號(hào)的估計(jì)或預(yù)測(cè),并將其編碼為視覺上某個(gè)物體(如一條水平線)的存在。
圖1.初級(jí)視覺皮層(V1),位于大腦內(nèi)側(cè)枕葉的距狀溝中(后腦勺左右側(cè))。
V1是皮層中的“第一個(gè)”視覺處理區(qū)域, LGN(外側(cè)膝狀體核,位于丘腦,接受視網(wǎng)膜大部分視覺信息輸入)將大部分軸突信號(hào)發(fā)送至V1皮層。
從這個(gè)角度出發(fā),作者對(duì)比了計(jì)算中涉及的單位脈沖間隔的興奮性電流中恢復(fù)離子梯度的 ATP 成本,以及通信中涉及的諸如軸突靜息電位、動(dòng)作電位和囊泡回收等成本,最終得出結(jié)論:通信相關(guān)的生物物理過程消耗的能量是計(jì)算相關(guān)過程的 35 倍(生物相關(guān)單位以每秒消耗 ATP 分子計(jì),物理單位以每秒消耗焦耳計(jì)) [19]。
通信與計(jì)算能耗的巨大差異為參考文獻(xiàn) [4] 中隱含的發(fā)現(xiàn)證明,其作者表明神經(jīng)信號(hào)傳導(dǎo)和神經(jīng)遞質(zhì)釋放的突觸后效應(yīng)支配著大腦的功耗。來自參考文獻(xiàn) [15] 的另一條證據(jù)表明,神經(jīng)元中的線粒體分布會(huì)追蹤放電率和突觸傳遞,因此軸突的粗細(xì)很可能取決于突觸終端的能耗需求,她占哺乳動(dòng)物大腦能耗的 65% [20]。
在先前建立的框架中,文獻(xiàn)[4]與[15]中描述的高能耗過程都是通信過程,不包括文獻(xiàn)[19]中的計(jì)算過程。有趣的是,Levy 和 Calvert 還估計(jì),27% 的皮層能量支出是用于與突觸發(fā)生相關(guān)的過程,例如通過肌動(dòng)蛋白聚合、膜合成和摻入,以及相關(guān)的細(xì)胞內(nèi)運(yùn)輸?shù)纳L(zhǎng)。這進(jìn)一步細(xì)化了先前的能量預(yù)算,表明大腦將四分之一以上的能量用于促進(jìn)持續(xù)學(xué)習(xí),這與我們對(duì)大腦的印象相一致。
圖2.一個(gè)典型的神經(jīng)元由胞體(cell body),樹突(dendrite)和軸突(axon)組成
軸突的最遠(yuǎn)端是突觸(synapse),神經(jīng)元可以通過突觸將信號(hào)傳輸?shù)搅硪粋€(gè)細(xì)胞。
3. 大腦耗能對(duì)計(jì)算機(jī)設(shè)計(jì)的啟發(fā)
在物理層面,Levy 和 Calvert 計(jì)算出皮層灰質(zhì)消耗了大約 3 W 的功率,而根據(jù)大腦葡萄糖攝取量,估計(jì)大腦功率消耗為 17~20 W [1 , 2],其中 10% 在正常情況下未被使用,大約 9W 以熱量形式耗散,剩余能量為大腦其余部分供能。
對(duì)皮層灰質(zhì) 3 W 的功耗估計(jì)與 Lennie [21] 早期工作的結(jié)果一致。但 Lennie 使用 20 年前可用的數(shù)據(jù),發(fā)現(xiàn)大腦能量預(yù)算的劃分略有不同——大腦50%的功耗用于與神經(jīng)電信號(hào)活動(dòng)(即計(jì)算和通信)無關(guān)的過程。該結(jié)論與當(dāng)前研究的差異部分來自于生物物理數(shù)據(jù),包括對(duì)突觸數(shù)量及其接通率(success rate)的估計(jì)。新的估計(jì)還表明,灰質(zhì)中每個(gè)神經(jīng)元的能耗大約為2×10-9W,這與 Herculano-Houzel的工作一致[22] 。
Levy 和 Calvert 根據(jù)噪聲神經(jīng)積分器輸入和輸出之間的互信息,來估計(jì)大腦每焦耳能耗所計(jì)算的信息比特?cái)?shù)。在這個(gè)定義下,他們發(fā)現(xiàn)神經(jīng)元每比特的計(jì)算能耗是 Landauer 理想熱力學(xué)極限*[23] 的108倍。他們認(rèn)為這一巨大差異源于通信成本(Landauer 忽略了這一點(diǎn))和生物需要快速響應(yīng)行為的計(jì)算需求。通信成本和快速計(jì)算需求這兩個(gè)約束無疑是相關(guān)的,研究人員希望在未來仔細(xì)檢驗(yàn)關(guān)于計(jì)算的定義,以及由活細(xì)胞計(jì)算施加的生物物理約束。
*譯注:Landauer 原理表明,擦除1比特信息在理論上至少要產(chǎn)生kBTln2 的能量耗散,這被稱為L(zhǎng)andauer極限。
在 Levy 和 Calvert 的分析中,能量預(yù)算和每焦耳能耗所計(jì)算的比特?cái)?shù)都取決于一個(gè)參數(shù):皮質(zhì)錐體神經(jīng)元的平均輸入突觸數(shù)乘以她們的接通率。他們發(fā)現(xiàn),當(dāng)這個(gè)參數(shù)大約為 2000 時(shí),每焦耳能耗所計(jì)算的比特?cái)?shù)估值將最大化,接近于他們從數(shù)據(jù)中得出的值。這個(gè)有趣的結(jié)果讓人想起之前使用能源效率來理解神經(jīng)放電應(yīng)該如何組織的研究 [11, 13],以及信息應(yīng)該如何在大腦中的細(xì)胞和結(jié)構(gòu)之間進(jìn)行分配的研究 [14, 17]。這項(xiàng)新工作為更精細(xì)地分析大腦中的回路結(jié)構(gòu)以及大腦如何劃分計(jì)算任務(wù)打開了大門。
圖3. 大腦中的計(jì)算分布在網(wǎng)絡(luò)中通信的特定組件之間。
綠色圓圈表示皮質(zhì)區(qū)域網(wǎng)絡(luò),每個(gè)區(qū)域執(zhí)行不同的功能。橙色三角形表示錐體細(xì)胞網(wǎng)絡(luò),她們通過協(xié)作計(jì)算單個(gè)皮質(zhì)區(qū)域的功能。Levy 和 Calvert 認(rèn)為基本單元的計(jì)算成本相比于她們之間的通信成本而言微不足道。
Levy 和 Calvert 的結(jié)果與在持續(xù)計(jì)算和通信方面解釋區(qū)域腦代謝的功能性磁共振成像(fMRI)測(cè)量值是相關(guān)的。新數(shù)據(jù)也適用于對(duì)大腦演化的研究,如針對(duì)大腦代謝成本高昂 [7] 及代謝生理上限制大腦結(jié)構(gòu) [8, 22] 的研究。
Levy 的研究結(jié)果也會(huì)引發(fā)工程師對(duì)設(shè)計(jì)下一代低功耗智能計(jì)算設(shè)備的興趣。研究指出由大腦灰質(zhì)完成的計(jì)算和通信僅需3W的功率,即使加上用于保溫的9W功率,這一功耗也比典型的筆記本電腦低出近一個(gè)數(shù)量級(jí)。
先前的工作表明,信息處理速率和能耗間存在的收益遞減規(guī)律將推動(dòng)計(jì)算機(jī)向異構(gòu)架構(gòu)發(fā)展,在這種架構(gòu)中,整體功能在各尺度上通過大量特定單元間的協(xié)作涌現(xiàn),每個(gè)特定單元以物理基質(zhì)決定的最高效率處理信息[17]。Levy 和 Calvert 的論文表明,這種向異構(gòu)架構(gòu)的轉(zhuǎn)變必須平衡好不同組件之間的網(wǎng)絡(luò)學(xué)習(xí)成本和通信成本,因?yàn)楸M管每個(gè)單元的計(jì)算成本相對(duì)較低,但單元間的通信成本將是高昂的。
Vijay Balasubramanian | 作者
張澳 | 翻譯
梁金 | 審校
鄧一雪 | 編輯
商務(wù)合作及投稿轉(zhuǎn)載|swarma@swarma.org
◆ ◆ ◆
搜索公眾號(hào):集智俱樂部
加入“沒有圍墻的研究所”
讓蘋果砸得更猛烈些吧!