人工智能是否終將超越人類智能_原創(chuàng)精品

2016年3月9～15日，谷歌公司研發(fā)的AlphaGo圍棋軟件與韓國(guó)棋圣李世石進(jìn)行了五場(chǎng)人機(jī)對(duì)決，AlphaGo以4比1的比分取得了壓倒性的勝利。這個(gè)比賽結(jié)果不僅震驚了整個(gè)圍棋界，也讓人工智能領(lǐng)域的許多專家學(xué)者跌破眼鏡，更讓人工智能走出象牙塔，成為許多普通百姓茶余飯后的熱點(diǎn)話題。這場(chǎng)人機(jī)圍棋巔峰對(duì)決不僅向全世界展示了人工智能的強(qiáng)大實(shí)力與巨大應(yīng)用潛力，也在人類社會(huì)引起了不小的恐慌和憂慮。人們開始認(rèn)真思考以下這些問題：機(jī)器智能最終會(huì)超越人類智能嗎？人工智能將會(huì)如何改變?nèi)祟惿鐣?huì)？未來的智能機(jī)器會(huì)像電影《終結(jié)者》里所描述的那樣試圖主宰人類、甚至消滅人類嗎？要想回答這些問題，我們首先需要了解人工智能的本質(zhì)及其基本原理，進(jìn)而討論其發(fā)展的規(guī)律和前景。當(dāng)前，人工智能領(lǐng)域最前沿的分支學(xué)科當(dāng)屬機(jī)器學(xué)習(xí)分支。本文首先對(duì)機(jī)器學(xué)習(xí)分支中最受世人矚目的研究成果——深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)——做一個(gè)簡(jiǎn)單綜述，進(jìn)而圍繞機(jī)器學(xué)習(xí)的本質(zhì)及其基本原理進(jìn)行探討。接下來，通過對(duì)人腦認(rèn)知機(jī)理最新研究成果的概括介紹，揭示機(jī)器智能與人類智能的本質(zhì)差異，比較兩種智能的優(yōu)勢(shì)與劣勢(shì)。通過機(jī)器智能與人類智能的優(yōu)劣勢(shì)比較，試圖找出上述幾個(gè)問題的答案。

深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)

過去幾年里，深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)所取得的成就足以使它成為人工智能王冠上最光彩奪目的明珠。基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的語音識(shí)別系統(tǒng)把語音識(shí)別的精度提高到了產(chǎn)品級(jí)的精度，從而為人類與計(jì)算機(jī)及各種智能終端之間提供了一種嶄新的、更為便捷的交互方式。將深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像內(nèi)容及人臉的識(shí)別，科學(xué)家們?nèi)〉昧四軌蚺c人類視覺系統(tǒng)相媲美的識(shí)別精度。戰(zhàn)勝韓國(guó)棋圣李世石的谷歌圍棋軟件AlphaGo能夠取得如此輝煌的戰(zhàn)績(jī)，深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)也發(fā)揮了關(guān)鍵性的作用。接下來，我們對(duì)深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的起源及其原理做一個(gè)簡(jiǎn)單介紹。

腦神經(jīng)科學(xué)領(lǐng)域的大量研究表明，人腦由大約1011個(gè)神經(jīng)細(xì)胞及1015個(gè)神經(jīng)突觸組成，這些神經(jīng)細(xì)胞及其突觸構(gòu)成一個(gè)龐大的生物神經(jīng)網(wǎng)絡(luò)。每個(gè)神經(jīng)細(xì)胞通過突觸與其它神經(jīng)細(xì)胞進(jìn)行連接與信息傳遞。當(dāng)通過突觸所接收到的信號(hào)強(qiáng)度超過某個(gè)閾值時(shí)，神經(jīng)細(xì)胞便會(huì)進(jìn)入激活狀態(tài)，并通過突觸向上層神經(jīng)細(xì)胞發(fā)送激活信號(hào)。人類所有與意識(shí)及智能有關(guān)的活動(dòng)，都是通過特定區(qū)域神經(jīng)細(xì)胞之間的相互激活與協(xié)同工作而實(shí)現(xiàn)的。

早于1943年，美國(guó)心理學(xué)家W.S. McCulloch和數(shù)學(xué)家W. A. Pitts就在他們的論文中提出了生物神經(jīng)元的計(jì)算模型(簡(jiǎn)稱M-P①模型），為后續(xù)人工神經(jīng)網(wǎng)絡(luò)的研究奠定了基礎(chǔ)。M-P模型的結(jié)構(gòu)如圖1(a)所示，它包含n個(gè)帶有權(quán)重的輸入，一個(gè)輸出，一個(gè)偏置b和一個(gè)激活函數(shù)組成。n個(gè)輸入代表來自下層n個(gè)神經(jīng)突觸的信息，每個(gè)權(quán)重W）代表對(duì)應(yīng)突觸的連接強(qiáng)度，激活函數(shù)通常采用擁有S-型曲線的sigmoid函數(shù)（參見圖1(b)），用來模擬神經(jīng)細(xì)胞的激活模式。

早期的人工神經(jīng)網(wǎng)絡(luò)大都是基于M-P神經(jīng)元的全連接網(wǎng)絡(luò)。如圖2所示，此類網(wǎng)絡(luò)的特點(diǎn)是，屬于同一層的神經(jīng)元之間不存在連接；當(dāng)前層的某個(gè)神經(jīng)元與上一層的所有神經(jīng)元都有連接。然而，人們很快發(fā)現(xiàn)，這種全連接神經(jīng)網(wǎng)絡(luò)在應(yīng)用于各種識(shí)別任務(wù)時(shí)不但識(shí)別精度不高，而且還不容易訓(xùn)練。當(dāng)神經(jīng)網(wǎng)絡(luò)的層數(shù)超過4層時(shí)，用傳統(tǒng)的反向傳遞算法（Back Propagation）訓(xùn)練已經(jīng)無法收斂。

tu 1

1983年，日本學(xué)者福島教授基于Hubel-Wiese的視覺認(rèn)知模型提出了卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型（Convolution Neural Network，簡(jiǎn)稱CNN）。早在1962年，Hubel和Wiesel通過對(duì)貓視覺皮層細(xì)胞的深入研究，提出高級(jí)動(dòng)物視覺神經(jīng)網(wǎng)絡(luò)由簡(jiǎn)單細(xì)胞和復(fù)雜細(xì)胞構(gòu)成（如圖3所示）。神經(jīng)網(wǎng)絡(luò)底層的簡(jiǎn)單細(xì)胞的感受野只對(duì)應(yīng)視網(wǎng)膜的某個(gè)特定區(qū)域，并只對(duì)該區(qū)域中特定方向的邊界線產(chǎn)生反應(yīng)。復(fù)雜細(xì)胞通過對(duì)具有特定取向的簡(jiǎn)單細(xì)胞進(jìn)行聚類，擁有較大感受野，并獲得具有一定不變性的特征。上層簡(jiǎn)單細(xì)胞對(duì)共生概率較高的復(fù)雜細(xì)胞進(jìn)行聚類，產(chǎn)生更為復(fù)雜的邊界特征。通過簡(jiǎn)單細(xì)胞和復(fù)雜細(xì)胞的逐層交替出現(xiàn)，視覺神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了提取高度抽象性及不變性圖像特征的能力。

卷積神經(jīng)網(wǎng)絡(luò)可以看作是實(shí)現(xiàn)上述Hubel-Wiesel視覺認(rèn)知模型的第一個(gè)網(wǎng)絡(luò)計(jì)算模型。如圖4所示，卷積神經(jīng)網(wǎng)絡(luò)是由卷積層（Convolution Layer）與降采樣層（Sampling Layer）交替出現(xiàn)的多層神經(jīng)網(wǎng)絡(luò)，每層由多個(gè)將神經(jīng)元排列成二維平面的子層組成（稱為特征圖，F(xiàn)eature Map）。每個(gè)卷積層和上層降采樣層通常擁有相同數(shù)量的特征圖。構(gòu)成卷積層x的每個(gè)神經(jīng)元負(fù)責(zé)對(duì)輸入圖像（如果x=1）或者x-1降采樣層的特征圖的特定小區(qū)域施行卷積運(yùn)算，而降采樣層y的每個(gè)神經(jīng)元?jiǎng)t負(fù)責(zé)對(duì)y-1卷積層的對(duì)應(yīng)特征圖的特定小區(qū)域進(jìn)行Max Pooling（只保留該區(qū)域神經(jīng)元的最大輸出值）。卷積運(yùn)算中所使用的卷積核系數(shù)都是通過學(xué)習(xí)訓(xùn)練自動(dòng)獲取的。卷積層中屬于同一個(gè)特征圖的神經(jīng)元都共享一個(gè)卷積核，負(fù)責(zé)學(xué)習(xí)和提取同一種圖像特征，對(duì)應(yīng)Hubel-Wiesel模型中某種特定取向的簡(jiǎn)單細(xì)胞。卷積層中不同的特征圖負(fù)責(zé)學(xué)習(xí)和提取不同的圖像特征，對(duì)應(yīng)Hubel-Wiesel模型中不同類型的簡(jiǎn)單細(xì)胞。而降采樣層y中神經(jīng)元的Max Pooling操作等同于Hubel-Wiesel模型中復(fù)雜細(xì)胞對(duì)同類型簡(jiǎn)單細(xì)胞的聚類，是對(duì)人腦視覺皮層復(fù)雜細(xì)胞的簡(jiǎn)化模擬。

上世紀(jì)90年代初期，貝爾實(shí)驗(yàn)室的Yann LeCun等人成功應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了高精度手寫數(shù)字識(shí)別算法，所提出的系列LeNet，都達(dá)到商用級(jí)識(shí)別精度，被當(dāng)時(shí)美國(guó)郵政局和許多大銀行用來識(shí)別信封上的手寫郵政編碼及支票上面的手寫數(shù)字。然而，受制于90年代計(jì)算機(jī)有限的內(nèi)存和弱小的運(yùn)算能力，LeNet網(wǎng)絡(luò)采用了較淺的網(wǎng)絡(luò)結(jié)構(gòu)，每層使用的特征圖數(shù)目也很少。盡管它在小規(guī)模圖像識(shí)別問題上取得了較好的效果，但與傳統(tǒng)機(jī)器學(xué)習(xí)算法（如SVM，AdaBoost等）相比，優(yōu)勢(shì)并不十分明顯。此外，由于卷積神經(jīng)網(wǎng)絡(luò)擁有很高的自由度，設(shè)計(jì)出一款性能優(yōu)異的網(wǎng)絡(luò)需要靈感并配合豐富的經(jīng)驗(yàn)積累，是一項(xiàng)極具挑戰(zhàn)性的工作。因此卷積神經(jīng)網(wǎng)絡(luò)在被提出后的很長(zhǎng)一段時(shí)間里并未得到足夠的重視和廣泛的應(yīng)用。

tu 2

2012年，加拿大多倫多大學(xué)Geoffrey Hinton教授的團(tuán)隊(duì)提出了一個(gè)規(guī)模比傳統(tǒng)CNN大許多的深度卷積神經(jīng)網(wǎng)絡(luò)（簡(jiǎn)稱AlexNet）。該網(wǎng)絡(luò)擁有5個(gè)卷積與降采樣層、3個(gè)全連接層，每個(gè)卷積與降采樣層擁有96?384個(gè)特征圖，網(wǎng)絡(luò)參數(shù)達(dá)到6000多萬個(gè)。利用AlexNet，Hinton團(tuán)隊(duì)在國(guó)際上最具影響力的圖像內(nèi)容分類比賽（2012 ImageNet ILSVRC）中取得了壓倒性勝利，將1000類圖像的Top-5分類錯(cuò)誤率降低到15.315％。在這次比賽中，獲得第二、三、四名的團(tuán)隊(duì)均采用了傳統(tǒng)機(jī)器學(xué)習(xí)算法。三個(gè)團(tuán)隊(duì)的Top-5圖像分類錯(cuò)誤率分別是26.17%、26.98%和27.06%，相差不到1個(gè)百分點(diǎn)，而他們的成績(jī)和第一名相比卻低了超過10個(gè)百分點(diǎn)，差距十分明顯。當(dāng)前，深度卷積神經(jīng)網(wǎng)絡(luò)（Deep CNN）相對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)算法的優(yōu)勢(shì)還在不斷擴(kuò)大，傳統(tǒng)學(xué)習(xí)方法在多個(gè)領(lǐng)域已經(jīng)完全無法與Deep CNN相抗衡。

機(jī)器學(xué)習(xí)算法的基本原理及其本質(zhì)

在幾千年的科學(xué)探索與研究中，科學(xué)家們提出了許多描述自然界及人類社會(huì)中各種事物與現(xiàn)象的數(shù)學(xué)模型。這些模型主要可以被歸納為以下三大類別。

歸納模型：由少數(shù)幾個(gè)參數(shù)（變量）構(gòu)成，每個(gè)變量都具有明確的物理意義。這類模型能夠真正揭示被描述對(duì)象的本質(zhì)及規(guī)律，許多數(shù)學(xué)和物理定律都是典型的歸納模型。

預(yù)測(cè)模型：用一個(gè)擁有大量參數(shù)的萬能函數(shù)來擬合用戶所提供的訓(xùn)練樣本。萬能函數(shù)的參數(shù)一般不具備任何物理意義，模型本身往往只能用來模擬或預(yù)測(cè)某個(gè)特定事物或現(xiàn)象，并不能揭示被描述事物或現(xiàn)象的本質(zhì)及內(nèi)在規(guī)律。當(dāng)代的大多數(shù)機(jī)器學(xué)習(xí)算法都是構(gòu)建于預(yù)測(cè)模型之上的。例如，單隱層全連接神經(jīng)網(wǎng)絡(luò)所使用的數(shù)學(xué)模型是：

上式中，x代表神經(jīng)網(wǎng)絡(luò)的輸入，代表神經(jīng)網(wǎng)絡(luò)的參數(shù)集，M是隱層神經(jīng)元的個(gè)數(shù)。這個(gè)數(shù)學(xué)模型如同一個(gè)橡皮泥，可以通過變換它的參數(shù)集被塑造成任何形狀。給定一個(gè)訓(xùn)練樣本集，其中分別代表訓(xùn)練樣本i以及人工賦予該樣本的標(biāo)簽（標(biāo)簽表示樣本的類別或某種屬性），通過利用T進(jìn)行訓(xùn)練，我們就能夠得到一個(gè)優(yōu)化的參數(shù)集，使神經(jīng)網(wǎng)絡(luò)能夠很好地?cái)M合訓(xùn)練樣本集T。當(dāng)新的未知樣本x出現(xiàn)時(shí)，我們就能夠利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)出它的標(biāo)簽y。顯而易見，神經(jīng)網(wǎng)絡(luò)的參數(shù)集規(guī)模與神經(jīng)元的數(shù)目及輸入x的維數(shù)成正比，所有參數(shù)沒有任何物理意義，模型本身也不具備揭示被描述對(duì)象的本質(zhì)及內(nèi)在規(guī)律的能力。

tu 3

直推模型：沒有明確的數(shù)學(xué)函數(shù)，利用所采集的大數(shù)據(jù)預(yù)測(cè)特定輸入的標(biāo)簽。此類模型認(rèn)為針對(duì)某個(gè)事物或現(xiàn)象所采集的大數(shù)據(jù)就是對(duì)該事物或現(xiàn)象的客觀描述。大數(shù)據(jù)的規(guī)模越大，對(duì)事物或現(xiàn)象的描述就越全面和準(zhǔn)確。當(dāng)新的未知樣本x出現(xiàn)時(shí)，我們可以在大數(shù)據(jù)中找到x的K近鄰，根據(jù)K近鄰的標(biāo)簽或?qū)傩詠頉Q定x的標(biāo)簽或?qū)傩?。顯而易見，由于不需要定義明確的數(shù)學(xué)模型，與其它模型相比，直推模型最簡(jiǎn)單直接，但因?yàn)橐揽看髷?shù)據(jù)來決定未知樣本的標(biāo)簽，直推模型往往需要較高的計(jì)算量及使用成本。同樣，直推模型也不能被用來揭示事物或現(xiàn)象的本質(zhì)及內(nèi)在規(guī)律。

應(yīng)當(dāng)指出，隨著互聯(lián)網(wǎng)用戶數(shù)量的不斷增長(zhǎng)以及互聯(lián)網(wǎng)技術(shù)的快速進(jìn)步，利用互聯(lián)網(wǎng)獲取內(nèi)容或用戶大數(shù)據(jù)變得越來越簡(jiǎn)單廉價(jià)，利用直推模型來預(yù)測(cè)某個(gè)事物或現(xiàn)象也變得越來越普及。例如，許多互聯(lián)網(wǎng)搜索引擎利用每個(gè)網(wǎng)頁的用戶點(diǎn)擊率來改進(jìn)搜索網(wǎng)頁的排序精度，就是直推模型在互聯(lián)網(wǎng)內(nèi)容搜索領(lǐng)域的一個(gè)成功應(yīng)用。

綜上所述，機(jī)器學(xué)習(xí)算法的本質(zhì)就是選擇一個(gè)萬能函數(shù)建立預(yù)測(cè)模型。利用用戶提供的訓(xùn)練樣本對(duì)模型進(jìn)行訓(xùn)練的目的，就是選擇最優(yōu)的參數(shù)集，使模型能夠很好地?cái)M合訓(xùn)練樣本集的空間分布。通過訓(xùn)練得到的預(yù)測(cè)模型，實(shí)際上把訓(xùn)練樣本集的空間分布提取出來并編碼到其龐大的參數(shù)集中。利用這個(gè)訓(xùn)練好的預(yù)測(cè)模型，我們就能夠預(yù)測(cè)新的未知樣本x的標(biāo)簽或?qū)傩?。?dāng)今大多數(shù)機(jī)器學(xué)習(xí)算法都是基于這個(gè)原理，谷歌公司的AlphaGo也不例外。

針對(duì)某個(gè)事物或現(xiàn)象所采集的訓(xùn)練樣本，是對(duì)該事物或現(xiàn)象的直觀描述，蘊(yùn)藏著大量與之相關(guān)的先驗(yàn)知識(shí)。例如，ImageNet ILSVRC國(guó)際圖像內(nèi)容分類比賽所提供的訓(xùn)練樣本集擁有1000類、總共一百多萬張彩色圖像。每一類都對(duì)應(yīng)自然界中的一種常見物體，如汽車、飛機(jī)、狗、鳥，等等，包含大約1000張從不同場(chǎng)景及不同角度拍攝的該種物體的彩色圖像。利用這個(gè)訓(xùn)練樣本集訓(xùn)練出來的深度卷積神經(jīng)網(wǎng)絡(luò)，實(shí)際上是將每類物體的共性特征及個(gè)體差異等進(jìn)行信息提取與編碼，并記憶到其龐大的參數(shù)集中。當(dāng)新的未知圖像出現(xiàn)時(shí)，神經(jīng)網(wǎng)絡(luò)就能夠利用已編碼到參數(shù)集中的這些先驗(yàn)知識(shí)，對(duì)輸入圖像進(jìn)行準(zhǔn)確的識(shí)別與分類。

同樣，谷歌公司在訓(xùn)練AlphaGo時(shí)，收集了20萬個(gè)職業(yè)圍棋高手的對(duì)局，再利用AlphaGo不同版本間的自我對(duì)弈生成了3000多萬個(gè)對(duì)局。3000多萬個(gè)圍棋對(duì)局包含了人類在圍棋領(lǐng)域所積累的最為豐富和全面的知識(shí)與經(jīng)驗(yàn)。當(dāng)新的棋局出現(xiàn)時(shí)，AlphaGo利用被編碼于其龐大參數(shù)集中的這些先驗(yàn)知識(shí)，預(yù)測(cè)出勝率最高的一步棋，以及這步棋所產(chǎn)生的最終勝率。由于AlphaGo針對(duì)3000多萬個(gè)對(duì)局進(jìn)行了學(xué)習(xí)與編碼，它對(duì)每一步棋的勝負(fù)判定甚至比九段棋手還要準(zhǔn)，人類棋圣輸給AlphaGo也就不足為奇了。

人類智能的本質(zhì)與特性

對(duì)于人腦及其高度復(fù)雜的智能，人類至今還所知甚少。關(guān)于“智能”這個(gè)名詞的科學(xué)定義，學(xué)術(shù)文獻(xiàn)中就存在著許多個(gè)版本。即使是少數(shù)幾個(gè)被深入研究的認(rèn)知功能（如人腦的視覺認(rèn)知功能）的工作機(jī)理，也還存在著各種各樣的假說和爭(zhēng)議。在這里，我們列出若干較具代表性、認(rèn)可度相對(duì)較高的關(guān)于人腦智能的假說及闡述。

人類智能的本質(zhì)是什么？這是認(rèn)知科學(xué)的基本任務(wù)，也是基礎(chǔ)科學(xué)面臨的四大難題（Simon）中最后、最難解決的一個(gè)。每門基礎(chǔ)科學(xué)都有其特定的基本單元，例如高能物理學(xué)的基本粒子，遺傳學(xué)的基因、計(jì)算理論的符號(hào)、信息論的比特等。因此，“人類智能的本質(zhì)是什么”這個(gè)問題在某種程度上取決于“什么是認(rèn)知基本單元”。眾所周知，適合描述物質(zhì)世界的變量并不一定適合描述精神世界。因此，認(rèn)知基本單元是什么這個(gè)問題，不能靠物理的推理或計(jì)算的分析來解決，根本上只有通過認(rèn)知科學(xué)的實(shí)驗(yàn)來回答。大量實(shí)驗(yàn)結(jié)果顯示，認(rèn)知基本單元不是計(jì)算理論的符號(hào)，也不是信息論的比特，而是知覺組織形成的“知覺物體”。例如，實(shí)驗(yàn)表明，當(dāng)人的視覺系統(tǒng)注意一只飛鳥的時(shí)候，它所注意的是整只鳥（即一個(gè)知覺物體），而不是鳥的某個(gè)特性（形狀、大小、位置等）。盡管在飛行過程中鳥的各種特征性質(zhì)在改變，但它是同一個(gè)知覺物體的性質(zhì)始終保持不變。諾獎(jiǎng)得主Kahneman認(rèn)為，知覺物體概念的直覺定義正是在形狀等特征性質(zhì)改變下保持不變的同一性。中科院陳霖院士領(lǐng)導(dǎo)的團(tuán)隊(duì)在發(fā)展了30多年的拓?fù)湫再|(zhì)知覺理論的基礎(chǔ)上，提出大范圍首先的知覺物體拓?fù)鋵W(xué)定義：知覺物體的核心含義，即在變換下保持不變的整體同一性，可以被科學(xué)準(zhǔn)確地定義為大范圍拓?fù)洳蛔冃再|(zhì)。應(yīng)當(dāng)指出，上述大范圍首先知覺物體的概念，與人工智能領(lǐng)域廣為認(rèn)同與采納的由局部到整體，由特征到物體，由具體到抽象的認(rèn)知計(jì)算模型是完全背道而馳的，因而在人工智能領(lǐng)域并沒有得到足夠的重視及應(yīng)用。

大量認(rèn)知科學(xué)領(lǐng)域的實(shí)驗(yàn)研究表明，人類智能具有以下幾個(gè)特性。

人類智能的目標(biāo)不是準(zhǔn)確。人類智能并不追求在精神世界里客觀準(zhǔn)確地再現(xiàn)物理世界。上帝設(shè)計(jì)人類智能時(shí)，不假思索地直奔“生存”這一終極目標(biāo)而去：用最合理的代價(jià)，獲取最大的生存優(yōu)勢(shì)。人類大腦的平均能耗大約只有20瓦，相對(duì)于龐大的計(jì)算機(jī)系統(tǒng)來說只是九牛一毛。盡管人腦的重量只有1400克左右，約占人體重量的2.3%，但它的血液供應(yīng)量卻占到了全身的15.20%，耗氧量超過全身的20%，對(duì)于人類已經(jīng)接近其生理可以負(fù)擔(dān)的極限。在這種資源極其有限的條件下，人腦通過以下幾種方式實(shí)現(xiàn)了最有效的資源調(diào)配，由此來保障最有意義的生理和智能活動(dòng)。

第一，主觀能動(dòng)的選擇性。精神世界不是對(duì)物理世界的簡(jiǎn)單映射，而是非常扭曲和失真的。體積相對(duì)較小的手指、舌頭等重點(diǎn)區(qū)域，在感覺運(yùn)動(dòng)中樞里卻占據(jù)大部分的皮層區(qū)域。同樣，在視覺上只有對(duì)應(yīng)中央視野的視網(wǎng)膜具有很高的空間、顏色分辨率，而更廣泛的外周視野只對(duì)物體的突然出現(xiàn)或消失，以及物體的運(yùn)動(dòng)更敏感。人類視覺處理的通常方式是，外周視野的顯著變化會(huì)在第一時(shí)間被捕獲，做出應(yīng)激反應(yīng)，然后再把中央視野移動(dòng)到目標(biāo)上進(jìn)行后續(xù)的處理。

人類通過知覺組織的選擇性注意機(jī)制，直接感知輸入信號(hào)中的大范圍不變性質(zhì)，而忽略大量的局部特征性質(zhì)。大量視而不見的現(xiàn)象，在實(shí)驗(yàn)室研究中表現(xiàn)為注意瞬脫、變化盲視等等。比如，盡管可以清晰地分辨出霓虹燈中的色塊顏色、形狀各不相同，甚至在空間和時(shí)間上都不連續(xù)，人腦仍然把這些色塊看成是同一個(gè)物體，從而產(chǎn)生運(yùn)動(dòng)的感覺。研究表明，這種運(yùn)動(dòng)錯(cuò)覺本質(zhì)上不是運(yùn)動(dòng)，其生態(tài)意義在于對(duì)知覺對(duì)象進(jìn)行不變性抽提。另一方面，人腦會(huì)主動(dòng)把忽略的部分補(bǔ)充回來。而通過經(jīng)驗(yàn)知識(shí)，上下文關(guān)系等補(bǔ)充回來的信息，難免有錯(cuò)。所謂錯(cuò)覺就是精神世界和物理世界的錯(cuò)位。這些錯(cuò)覺的生態(tài)意義在于在有限資源條件下，快速直接地形成穩(wěn)定的感知。這種機(jī)制既是人類天馬行空的聯(lián)想能力和創(chuàng)造力的源泉，同時(shí)也是各種精神心理疾患的生物學(xué)基礎(chǔ)。

第二，模塊化的層次結(jié)構(gòu)和分布式表征。當(dāng)前認(rèn)知科學(xué)越來越依賴于腦成像技術(shù)的發(fā)展。功能模塊化假設(shè)認(rèn)為，大腦是由結(jié)構(gòu)和功能相對(duì)獨(dú)立、專司特定認(rèn)知功能的多個(gè)腦區(qū)組成。這些模塊組成復(fù)雜的層次結(jié)構(gòu)，通過層次間的傳遞和反饋實(shí)現(xiàn)對(duì)輸入信號(hào)的主動(dòng)調(diào)節(jié)。大量腦成像的研究實(shí)驗(yàn)也支持了這一假設(shè)，特別是視覺研究發(fā)現(xiàn)了非常詳細(xì)而復(fù)雜的功能模塊及其層次結(jié)構(gòu)。另一方面，分布式表征的假說認(rèn)為，認(rèn)知功能的神經(jīng)機(jī)制是相對(duì)大范圍的分布式腦狀態(tài)，而不是特定腦區(qū)的激活與否。當(dāng)前研究認(rèn)為，人腦是模塊化和分布式表達(dá)共存的自能系統(tǒng)。

第三，反應(yīng)性活動(dòng)和內(nèi)生性活動(dòng)。人腦不是一個(gè)簡(jiǎn)單的刺激—反應(yīng)系統(tǒng)，大量的內(nèi)生性活動(dòng)甚至比反應(yīng)性活動(dòng)還多。人腦在所謂的靜息狀態(tài)下的耗氧量與任務(wù)狀態(tài)下相比差別很小。然而幾乎所有的經(jīng)典認(rèn)知科學(xué)研究都是建立在刺激反應(yīng)實(shí)驗(yàn)范式的基礎(chǔ)之上。這種實(shí)驗(yàn)范式是讓實(shí)驗(yàn)對(duì)象在特定的條件下完成特定的認(rèn)知任務(wù)，收集并分析實(shí)驗(yàn)對(duì)象的行為或生理反應(yīng)，通過對(duì)實(shí)驗(yàn)數(shù)據(jù)的充分比照，建立人腦某種活動(dòng)模式或認(rèn)知機(jī)理的假設(shè)。內(nèi)生性活動(dòng)因其往往只能通過內(nèi)省的方式進(jìn)行研究，而被長(zhǎng)期排除在認(rèn)知科學(xué)的研究主流之外。隨著腦成像技術(shù)的發(fā)展，功能連接成為分析靜息態(tài)大腦自發(fā)活動(dòng)的有力工具。特別是默認(rèn)網(wǎng)絡(luò)的發(fā)現(xiàn)，創(chuàng)立了強(qiáng)調(diào)內(nèi)生性活動(dòng)的全新腦功能成像研究范式。默認(rèn)網(wǎng)絡(luò)被認(rèn)為涉及警覺狀態(tài)、自我意識(shí)、注意調(diào)控以及學(xué)習(xí)記憶等心理認(rèn)知過程，已被廣泛應(yīng)用于社會(huì)認(rèn)知、自我、注意、學(xué)習(xí)、發(fā)育、衰老機(jī)制的研究，有力推動(dòng)了各種腦生物指標(biāo)的完善和腦疾病的治療，這些疾病包括阿爾茲海默病、帕金森病、抑郁癥、精神分裂癥和自閉癥等等。

因此，整合現(xiàn)有研究中有關(guān)分布式表達(dá)和內(nèi)生性活動(dòng)的最新研究成果，可能會(huì)帶來對(duì)人腦活動(dòng)模式（人類智能的物質(zhì)基礎(chǔ)）一種全新的理解。

人類智能的本質(zhì)不是計(jì)算。人類智能體現(xiàn)在對(duì)外部環(huán)境的感知、認(rèn)知、對(duì)所觀察事物或現(xiàn)象的抽象、記憶、判斷、決策等。然而，這些智能并不是人類所獨(dú)有。許多高等動(dòng)物，如狗、猴子、猩猩，也或多或少具有類似的能力。同時(shí)，計(jì)算并不是人類智能的強(qiáng)項(xiàng)。真正將人類與其它動(dòng)物區(qū)分開來的，是人類的邏輯推理能力、想象力、創(chuàng)造力以及自我意識(shí)。人類利用這類能力能夠想象并且創(chuàng)造出自然界中不存在的東西，如汽車、飛機(jī)、電視、計(jì)算機(jī)、手機(jī)，互聯(lián)網(wǎng)。這類能力是推動(dòng)人類社會(huì)不斷發(fā)展與進(jìn)步的源泉，是生物智能的圣杯。

而對(duì)代表生物智能最高水平的上述能力，人類目前還所知甚少，對(duì)其機(jī)理的研究還處于啟蒙階段。研究表明，這些能力不是依靠計(jì)算得來的，而似乎是與聯(lián)想記憶及人類豐富的精神世界有關(guān)?；谀X信號(hào)的分析實(shí)驗(yàn)發(fā)現(xiàn)，人腦的海馬回、海馬旁回、杏仁核等腦區(qū)中存在著大量專司特定聯(lián)想記憶的神經(jīng)細(xì)胞。例如，上述腦區(qū)中存在單個(gè)或一小簇神經(jīng)細(xì)胞，會(huì)被與美國(guó)前總統(tǒng)克林頓相關(guān)的所有刺激信號(hào)所激活，無論刺激信號(hào)是關(guān)于克林頓的圖片，還是Clinton這個(gè)英語單詞，還是克林頓本人的語音回放。顯然，這些神經(jīng)細(xì)胞并不是被某個(gè)模態(tài)的特定特征所激活，它們所對(duì)應(yīng)的是克林頓這個(gè)抽象概念。此外，腦成像研究表明，圍棋專業(yè)棋手相對(duì)于業(yè)余棋手更多的是依賴聯(lián)想記憶系統(tǒng)，而非邏輯推理來下棋。實(shí)際上，圍棋界訓(xùn)練棋手的最常用方法就是將高手對(duì)局中的關(guān)鍵部分拆解成許多死活題，棋手通過大量死活題的解題訓(xùn)練來提高自己聯(lián)想記憶的經(jīng)驗(yàn)和效率。

機(jī)器智能與人類智能的優(yōu)勢(shì)與劣勢(shì)

當(dāng)代的計(jì)算機(jī)擁有強(qiáng)大的存儲(chǔ)與運(yùn)算能力。伴隨著計(jì)算技術(shù)的不斷發(fā)展與進(jìn)步，這些能力的增長(zhǎng)似乎還遠(yuǎn)沒有到達(dá)盡頭。早在1997年，IBM的“深藍(lán)”超級(jí)電腦就戰(zhàn)勝了國(guó)際象棋冠軍卡斯帕羅夫。但這次勝利在人工智能領(lǐng)域并沒有產(chǎn)生太大的反響，原因在于，“深藍(lán)”幾乎純粹是依靠強(qiáng)大的運(yùn)算能力遍歷所有的可能性，利用“蠻力”取勝的。“深藍(lán)”所遵循的，就是“人工智能即是計(jì)算加記憶”這個(gè)簡(jiǎn)單法則。由于圍棋的搜索空間比國(guó)際象棋大很多，“深藍(lán)”的這種制勝策略針對(duì)圍棋是行不通的。與“深藍(lán)”相比，AlphaGo的最大進(jìn)步就是從“計(jì)算加記憶”進(jìn)化到“擬合加記憶”法則。它利用深度卷積神經(jīng)網(wǎng)絡(luò)這個(gè)萬能函數(shù)，通過學(xué)習(xí)來擬合兩千多年來人類所積累的全部經(jīng)驗(yàn)及制勝模式，并將其編碼到神經(jīng)網(wǎng)絡(luò)的龐大參數(shù)集中。對(duì)于當(dāng)前棋局的任何一個(gè)可能的落子，訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)都能夠預(yù)測(cè)出它的優(yōu)劣，并通過有限數(shù)量的模擬搜索，計(jì)算出最終的獲勝概率。這樣的戰(zhàn)略不需要對(duì)棋局的所有可能性做遍歷搜索，更像人類棋手所使用的策略。然而，由于AlphaGo對(duì)每個(gè)落子以及最終勝率的預(yù)測(cè)，是建立在圍棋界兩千多年來所形成的完整知識(shí)庫(kù)之上的，它的預(yù)測(cè)比人類最優(yōu)秀的棋手更準(zhǔn)確。與其說李世石輸給了機(jī)器系統(tǒng)，不如說輸給了人類棋藝的集大成者。由此推斷，AlphaGo取勝也是情理之中的事。

與機(jī)器相比，人類智能的最大優(yōu)勢(shì)當(dāng)屬它的邏輯推理能力、想象力、創(chuàng)造力及其高效性。人腦功耗只有20多瓦，處理許多感知及認(rèn)知任務(wù)（如圖像識(shí)別、人臉識(shí)別、語音識(shí)別等）的精度與擁有龐大內(nèi)存、運(yùn)算速度達(dá)到萬億次的超級(jí)電腦相比卻毫不遜色。盡管機(jī)器智能很可能在不遠(yuǎn)的將來在棋牌類競(jìng)賽中全面超越人類，但現(xiàn)有的機(jī)器學(xué)習(xí)框架并不能模擬出人類的想象力和創(chuàng)造力。因此，在當(dāng)前情況下，機(jī)器智能全面超越人類智能的預(yù)測(cè)是不會(huì)成為現(xiàn)實(shí)的。

隨著機(jī)器學(xué)習(xí)算法的不斷發(fā)展與進(jìn)步，計(jì)算機(jī)借助強(qiáng)大的存儲(chǔ)與運(yùn)算能力，學(xué)習(xí)人類幾千年來發(fā)展與進(jìn)化過程中所積累的完整知識(shí)的能力越來越強(qiáng)，借助完整知識(shí)庫(kù)對(duì)復(fù)雜事務(wù)進(jìn)行預(yù)測(cè)與判斷的準(zhǔn)確度將會(huì)全面超越人類。由此推斷，在未來幾十年里，不僅是那些簡(jiǎn)單重復(fù)性的體力勞動(dòng)將會(huì)全面被機(jī)器取代，而且那些需要對(duì)復(fù)雜事務(wù)進(jìn)行評(píng)估與判斷的工作，如金融投資、企業(yè)管理、軍事指揮等，也有可能被讓位于機(jī)器智能。甚至大到整個(gè)國(guó)家，也可能會(huì)越來越依靠機(jī)器智能預(yù)測(cè)政治、經(jīng)濟(jì)、外交發(fā)展趨勢(shì)，制定最優(yōu)的政策方針及發(fā)展規(guī)劃。實(shí)際上，許多發(fā)達(dá)國(guó)家的智囊機(jī)構(gòu)已經(jīng)在利用各種評(píng)估及預(yù)測(cè)模型為政府提供對(duì)各種事物的預(yù)測(cè)與判斷，提出政策建議或解決方案。

然而，當(dāng)前的機(jī)器學(xué)習(xí)框架無法模擬人類的想象力及創(chuàng)造力，科學(xué)研究與發(fā)明創(chuàng)造仍將是人類的優(yōu)勢(shì)所在。不難預(yù)測(cè)，在未來人類社會(huì)的發(fā)展進(jìn)程中，將有越來越多的人從事科學(xué)研究以及新產(chǎn)品的設(shè)計(jì)研發(fā)工作。社會(huì)對(duì)每個(gè)人的知識(shí)能力、智慧以及發(fā)明創(chuàng)造力的要求將會(huì)越來越高，不具備這些能力的人們將會(huì)無法找到滿意的工作，逐漸成為處于社會(huì)底層的貧困階層。了解并解決科技迅速發(fā)展所帶來的社會(huì)挑戰(zhàn)，仍然是人類需要面對(duì)的任務(wù)，而機(jī)器是無法替代人類解決這些問題的。

（中科院生物物理所腦與認(rèn)知國(guó)家重點(diǎn)實(shí)驗(yàn)室周天罡、西安交通大學(xué)電信學(xué)院韓勁松對(duì)本文亦有貢獻(xiàn)）

責(zé) 編／凌肖漢

Will Artificial Intelligence Surpass Human Intelligence Ultimately?

——Discussion Based on Basic Principle of Machine Learning and Human Cognition

Gong Yihong

Abstract: Recently, the smashing 4-1 win of Google’s AlphaGo over the South Korean Go Master Lee Sedol has not only shown the power and great potentials of artificial intelligence, but also caused panic and worries in the human society. People begin to think carefully about the progress and challenges that artificial intelligence will bring to the human society and whether artificial intelligence will ultimately surpass human intelligence. To find the answer, we need to first understand the essence and basic principles of artificial intelligence. In the beginning, this article briefly described the deep Convolutional Neural Networks (deep CNN)—the most popular research result in the field of machine intelligence to date, and then discussed the essence and basic principles of machine learning. After that, with an overview of the latest research discoveries about human brain’s cognitive mechanism, this article tried to reveal the essential differences between machine intelligence and human intelligence, and compared their advantages and disadvantages in order to find the answers to the foregoing questions.

Keywords: artificial intelligence, AlphaGo, neural synapse, machine learning, pattern recognition

龔怡宏，西安交通大學(xué)人工智能與機(jī)器人研究所教授、博導(dǎo)，中組部“千人計(jì)劃”教授，國(guó)家973項(xiàng)目首席科學(xué)家，視覺信息處理國(guó)家工程實(shí)驗(yàn)室首席科學(xué)家。研究方向?yàn)槎嗝襟w內(nèi)容分析、機(jī)器學(xué)習(xí)、模式識(shí)別。主要著作有主要著作有《Intelligent Image Databases - Towards Advanced Image Retrieval》《Machine Learning for Multimedia Content Analysis》等。

精品911国产高清在线观看,久操国产在线,日日夜夜欧美,www.五月激情,五月激激激综合网色播免费,久久精品2021国产,国产成在线观看免费视频成本人

人工智能是否終將超越人類智能

——基于機(jī)器學(xué)習(xí)與人腦認(rèn)知基本原理的探討

相關(guān)新聞