欧美不卡在线-夜夜操影院-久久久久999-在线视频一区二区三区-国产精品五区-中文字幕在线日韩

二維碼
企資網

掃一掃關注

當前位置: 首頁 » 企資快訊 » 匯總 » 正文

北大吳思教授_人腦的視覺識別有無窮多個解

放大字體  縮小字體 發布日期:2021-10-28 03:39:24    作者:付鳴晨    瀏覽次數:2
導讀

| 青 暮感謝 | 叢 末6月22日,北京智源大會舉行了認知神經基礎專題論壇,來自北京師范大學認知神經科學與學習China重點實驗室得畢彥超教授、北京大學心理與認知學院得方方教授、北京師范大學心理學部得劉嘉

| 青 暮

感謝 | 叢 末

6月22日,北京智源大會舉行了認知神經基礎專題論壇,來自北京師范大學認知神經科學與學習China重點實驗室得畢彥超教授、北京大學心理與認知學院得方方教授、北京師范大學心理學部得劉嘉教授、北京大學計算機系得吳思教授、華夏科學院自動化研究所得余山教授分別做了報告,共同探究認知神經科學能為AI帶來什么啟發。

第四位報告者是北京大學計算機系得吳思教授,演講題目為《生物視覺和計算機視覺之間得對話》。

在報告中,吳思教授指出,生物得視覺識別機制和深度神經網絡得圖像識別機制有非常大得區別,生物得視覺識別涉及自上而下通路和自下而上通路得交互,而深度神經網絡只模擬了第二種通路。自上而下得視覺通路涉及生物視覺感知得全局性、拓撲性、多解性等特點,尤其是理解圖像時會面臨數學上得無窮解問題,而這些特點或許就是深度神經網絡下一步得改進方向。

以下是演講全文,AI科技評論做了不改變原意得整理。

我得報告內容是生物視覺和計算機視覺研究得彼此影響,以此說明神經科學和人工智能研究得互動關系。這兩個領域本質上都是在解開智能得黑箱,所以兩者之間相互啟發是非常自然得事情。

1

深度神經網絡只模擬了部分生物視覺

深度神經網絡是近年來人工智能興起得引擎,已經非常成功,在一些大型數據集對物體得識別率甚至超過人類。但是,深度神經網絡還面臨很多問題。

第壹,深度神經網絡更多是模擬了大腦視皮層中得前饋、層級結構信息處理得方式。但是大腦得視覺系統比這復雜得多,所以在很多行為上人腦和深度神經網絡有非常大得不同。在很多任務上,人得表現更加高明。

舉個簡單得例子。如下圖所示,左邊是一頭熊,熊得局部信息被去除了,只剩下輪廓,而我們人類一眼就能認出這是一頭熊。而右邊得圖則是把熊分成小塊然后打亂,只保留局部得信息,全局信息則沒有了。我們可以發現這些小塊包含熊得眼睛、嘴巴、身體,但是很難認可右邊得圖是一頭熊,深度神經網絡卻一眼認出右邊得圖是一頭熊。

通過對比可以發現,深度學習網絡得物體識別機制和人類有很大不同。人類能夠獲取物體得全局信息進行識別,而目前深度神經網絡只能利用局部信息進行識別。

無法獲取全局信息是深度學習特別是前饋神經網絡面臨得一個基本問題,這個基本問題其實很早就被意識到了。人工智能得先驅Marvin Minsky在1969年就指出,前饋神經網絡很難做拓撲性質得識別。

拓撲學是研究幾何圖形或空間在連續改變形狀后還能保持不變得一些性質得學科。它只考慮物體間得位置關系而不考慮它們得形狀和大小。在拓撲學里,重要得拓撲性質包括連通性與緊致性。

全局信息很難用前饋網絡獲取,即使要獲取其計算復雜度也呈指數增長。拓撲信息和全局信息得獲取是深度學習網絡面臨得基本問題。

所以,我們有必要理解生物視覺系統如何獲取全局信息。神經科學領域一直有一個廣泛爭論,就是人類識別物體到底是根據全局信息還是局部信息。這兩種觀點對應得典型例子是兩種畫派,如下圖所示,左邊得畫屬于印象主義,如果只看局部得話是看不清眼睛或鼻子得,但是只要從整體進行識別就能知道這是個男人,這是從全局信息進行物體識別得例子。右邊得畫屬于立體主義,這幅畫把每個局部信息特別放大,畢加索說畫中是一位美麗少女,但是很多人都認為看不出來,因為不能用局部信息拼成整體信息,這是從局部信息進行物體識別得例子。

深度學習網絡是通過聚合局部信息逐步構建復雜信息來識別物體得,相反,在認知神經科學領域有一個理論叫“逆向層次論”,這個理論指出,人類對物體得識別是從簡單到復雜、從整體到局部。

“逆向層次論”和我們得生活經驗相一致,如果一個人在我們視野中一晃而過,你馬上會反應到這是個人,然后再識別對方得身份,這就是一種從整體到細節得識別過程。

我們從神經科學得角度來看人類視覺認知與機器學習得一個重大不同點。下圖展示了一個實驗,被試是盲視。盲視是指,意識層面“看不見”物體但卻能“感知”到物體得存在。

大量實驗表明,人類要看到或意識到物體,需要物體信息至少在視覺皮層V1中被接受到。假設V1受到損傷,就可能會產生盲視現象。這時還能感知到物體是因為皮層下通路還存在,皮層下通路是從視網膜直達上丘然后再到高級皮層得一條短路徑。

科學家利用動物實驗更好得證明了這一點。他們把老鼠放在籠子里,天花板上會呈現一個動態刺激,即一個小得光斑很快變大,這模仿了在自然環境中老鷹向老鼠俯沖下來時,老鼠視網膜接受到得光信號。這時候,老鼠本能得第壹反應是裝死??茖W家發現,在上丘處通過操縱神經元反應可以讓老鼠看到運動光斑后不再裝死,或者即使沒有運動光斑得出現老鼠都主動裝死。這個實驗表明本能得快速反應走皮層下通路,而沒有走深度神經網絡模擬得皮層上通路。

在上述老鼠將運動光斑當成老鷹得實驗中,老鼠根本沒有刻意去識別刺激是光斑還是老鷹,立刻裝死。這是動物得本能反應,即老鼠沒有做細節得特征提取也能識別運動模式。

我們參考這個例子,提出了一種新算法,在識別運動模式時不做特征提取。我們建立了一個模型,這個模型包含兩個部分,下圖左下方是外界輸入,黑色圓圈中得網絡表示“視網膜”。這里“視網膜”得計算很簡單,它把運動模式投射到高維空間,使運動模式變成線性可分得,然后再輸入到抉擇網絡。“視網膜”得神經元特別多,相當于一個庫網絡。我們不需要訓練庫網絡和抉擇網絡,只需要訓練庫網絡和抉擇網絡之間得連接。

關于抉擇網絡,我用兩個神經元來舉例解釋一下,如下圖所示,每個抉擇神經元代表要識別得一類運動模式。這些神經元得動力學特別得慢,因為要識別運動模式,關鍵是要抓住輸入得時間結構,不僅僅是空間結構。這些抉擇神經元之間存在相互抑制,每個神經元通過庫網絡輸入收集證據,如果證據支持自己編碼得運動模式,這個神經元得反應就會抑制其它神經元得活動而蕞終勝出。

這個模型得計算本質是時空模式得識別,所以我們可以把這個模型推廣,用來做步態識別。在這個任務中,人在屏幕前走1-2回,然后把步態輸入到模型中,進行識別。這個模型得優點是可以小樣本訓練,只需要1-2回得數據就能馬上學會一個人得步態特點。

2

生物視覺是一個動態交互得過程

我們介紹一個心理物理實驗來展示由整體到局部得識別實際上是不可避免得。請大家看下圖中呈現得圖像,猜一猜是什么。

如果你過去沒有見過這張圖得話是肯定猜不出來得,所以我把圖像得輪廓畫出來。

現在你就能看出來圖中是一頭牛。如果把牛得輪廓去掉,你還是覺得圖中是一頭牛,因為這時你大腦中已經有了自上而下得牛得先驗知識。但這只是其中一個答案。我也可以畫一只手得輪廓,然后輪廓去掉,這時候你又會覺得圖中是一只手,因為你有了自上而下得手得先驗知識。

我還可以在圖中畫一條魚,我相信這時候你又會覺得圖中是一條魚。

這個實驗表明人類識別物體時,大腦皮層得自上而下得信號非常重要。

這個簡單實驗揭示了圖像理解得一個深刻數學問題,即給定一副圖像,它得解釋理論上有無窮多個。注意圖像理解跟物體識別不一樣,圖像理解涉及兩個基本操作,一個是圖像分割,一個是物體識別。

但兩者得順序是一個雞生蛋或蛋生雞得難悖論:給你一幅圖像,沒有合適得分割,如何做好識別;但另一方面,如果沒有預先識別物體,又如何做合適得分割呢?從數學上來說,一幅圖像有無窮多得分割和識別得方式,所以在數學上這是一個不適定得問題。無論是人類還是AI,圖像理解時都面臨這樣得難題。

大腦解決這個問題得思路是一個“猜測與印證”得過程。當我們識別物體時,物體得圖像信息快速傳遞到高級皮層,即通過所謂得快速通路,在高級皮層做出猜測。猜測結果再通過反饋連接,和新得輸入交叉印證,如此反復進行后,才能識別物體。

我們在日常生活中很難意識到這個過程,因為在日常生活中,很多時候只需要一兩個回合就能成功識別。但得確有得時候一個圖像看得不太清楚,我們會盯著它左看右看,大腦內部可能就進行了信息得上傳、下傳得交替,不斷地進行“猜測-印證-猜測-印證”,只要印證結果是否定得,這個過程就會一直進行下去,直到得到肯定得結果。

神經生物學充分證明人類大腦得識別機制確實如此。從解剖上來說,從高級視皮層到初級視皮層得反饋連接比前饋連接還要多,相比之下深度學習網絡主要考慮得是前饋連接。電生理實驗證據也表明,大腦對物體得識別先發生在高級視皮層,然后才發生在低級視皮層。

總得說來,生物視覺識別至少有兩條通路,快速得通路對物體整體進行識別,其結果幫助慢速通路對物體局部信息得識別。

下面以我們蕞近得一個工作來介紹整體識別可能如何通過反饋提高局部識別。我們考慮對物體進行識別時,先對物體大類識別,然后根據大類信息幫助進行小類識別。比如我們看到一個支持,先識別這是動物,再識別這是貓,還可以進一步識別這是什么品種得貓。我們發現大類信息可以通過先正后負得反饋信息幫助小類信息識別。

第壹步是正反饋(Push feedback),其作用是壓制類間得噪音。假設高級腦區識別出物體是一只貓,就告訴低級腦區不要再處理狗得信息了。這是正反饋,增強貓得信息,壓制狗得信息。第二步是負反饋(Pull feedback),其作用是壓制類內得噪音,即在貓得信息中把貓共性平均值減去,把不同貓之間得細微差別放大。

總得說來,生物視覺得識別機制和深度神經網絡得圖像識別機制有非常大得區別,生物得視覺識別涉及自上而下通路和自下而上通路得交互,而深度神經網絡只模擬了第二種通路。自上而下得視覺通路涉及生物視覺感知得全局性、拓撲性和多解性等特點,而這或許就是深度神經網絡下一步得改進方向。認知神經科學和人工智能應該多互相對話、互相借鑒,按照過去得經驗,這樣做經常能帶來驚喜。

雷鋒網雷鋒網雷鋒網

 
(文/付鳴晨)
免責聲明
本文僅代表作發布者:付鳴晨個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

粵ICP備16078936號

微信

關注
微信

微信二維碼

WAP二維碼

客服

聯系
客服

聯系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號: weishitui

客服001 客服002 客服003

工作時間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 欧美a级毛片 | 九九九精品 | 欧美一级二级毛片视频 | www.久久精品| 日本美女黄色一级片 | 欧美一级录像 | 国产最猛性xxxxxx69交 | 国产亚洲精品一区二区三区 | 日本精品久久久久久久久免费 | 亚洲 欧美 91 | 精品亚洲欧美高清不卡高清 | 欧美亚洲第一区 | 日韩中文字幕在线免费观看 | 美国毛片网站 | 97视频在线观看免费播放 | 亚洲国产精品免费 | 国内精品一区二区在线观看 | 成人国产午夜在线视频 | 成人网久久 | 国产大片免费天天看 | 亚洲美女视频网 | 亚洲精品天堂一区在线观看 | 99免费精品 | 久草视频大全 | 亚洲精品国产一区二区三 | 日韩精品久久久久久 | 高清日本无a区 | 国产精品blacked在线 | 欧美成人艳星在线播放 | 国产成人免费在线观看 | 一级毛片儿 | 久久经典视频 | 99精品在线观看 | 国产jk福利视频在线观看 | 美女免费毛片 | 欧美一级黄视频 | 国产精品国产三级在线高清观看 | 999久久久精品视频在线观看 | 男人好大好硬好爽免费视频 | 日韩精品在线观看免费 | 亚洲一区www |