人類在漫長(zhǎng)的進(jìn)化中,獲得了一種能通過(guò)感知、邏輯推理來(lái)與世界互動(dòng)、認(rèn)識(shí)世界的能力。當(dāng)一個(gè)梨擺在我們面前時(shí),我們能夠通過(guò)嗅覺(jué)、視覺(jué)等,判斷出它是梨而非蘋果。當(dāng)在路上行駛時(shí),即使行人被部分遮擋住,我們也能從露出的部分體貌特征判斷出這是一個(gè)人,從而進(jìn)行避讓。
在人工智能領(lǐng)域,科學(xué)家們也一直試圖讓機(jī)器擁有像人一樣的邏輯思維能力,幫助人完成更多工作。
近日,在2020 ICLR大會(huì)上,圖靈獎(jiǎng)得主舒亞·本吉?dú)W(Yoshua Bengio)和揚(yáng)·勒昆(Yann LeCun)發(fā)表觀點(diǎn)稱,自監(jiān)督學(xué)習(xí)有望使AI產(chǎn)生類人的推理能力。本吉?dú)W相信機(jī)器最終可以習(xí)得關(guān)于這個(gè)世界的各種知識(shí),這種知識(shí)的獲得并不需要機(jī)器去親身體驗(yàn)各種真實(shí)發(fā)生的事件,而是通過(guò)習(xí)得語(yǔ)言化的知識(shí)來(lái)實(shí)現(xiàn)。
那么機(jī)器如何具備類人的推理能力?想具備類人的推理能力還要逾越哪些障礙?
“死記硬背”讓機(jī)器難有邏輯能力
購(gòu)物時(shí),無(wú)需出示支付碼,將面部特征綁定銀行卡就能輕松消費(fèi);回家路上,查詢手機(jī)地圖,可以看出哪些地段擁堵;到飯點(diǎn)了,跟機(jī)器人對(duì)話叫外賣……這些基于機(jī)器學(xué)習(xí)的應(yīng)用,正在讓人工智能變得可觀可感。但機(jī)器學(xué)習(xí)面臨的挑戰(zhàn)便是,需要大量數(shù)據(jù)的積累以及很強(qiáng)的算力。
機(jī)器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。“監(jiān)督學(xué)習(xí)需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)簽分類,數(shù)據(jù)需要涵蓋所有可能的場(chǎng)景,此外,完成學(xué)習(xí),機(jī)器還需要大量的算力。例如,如果希望創(chuàng)建圖像分類模型,則必須為系統(tǒng)提供經(jīng)過(guò)適當(dāng)分類標(biāo)記的大量圖像,讓模型在其中進(jìn)行充分訓(xùn)練。有時(shí)數(shù)據(jù)量達(dá)到百萬(wàn)、千萬(wàn)級(jí)規(guī)模,需要幾百萬(wàn)、上千萬(wàn)次的迭代。”中國(guó)科學(xué)院自動(dòng)化研究所研究員、視語(yǔ)科技創(chuàng)始人王金橋告訴科技日?qǐng)?bào)記者。
因此,減少對(duì)數(shù)據(jù)的依賴,一直是研究人員最重要的探索方向之一。在南京航空航天大學(xué)計(jì)算機(jī)學(xué)院教授陳松燦看來(lái),監(jiān)督學(xué)習(xí)往往需要大量的帶有注釋、標(biāo)記的數(shù)據(jù),而標(biāo)記這些數(shù)據(jù),需要人工完成,既耗時(shí)又昂貴。
然而,即使是在有大量數(shù)據(jù)“打底”的監(jiān)督學(xué)習(xí)環(huán)境中,一旦機(jī)器遇到不同于訓(xùn)練示例的全新狀況,也面臨著失控的風(fēng)險(xiǎn)。
“例如無(wú)人駕駛汽車行駛在一條陌生的道路上,前方雖然出現(xiàn)了路桿,但如果此前系統(tǒng)沒(méi)有遇到過(guò)這種道路模式,就會(huì)撞上去。進(jìn)入攝像頭視野的行人,如果未露出全貌,那系統(tǒng)就無(wú)法判斷出這是一個(gè)人,也會(huì)撞上去。還有我們進(jìn)入停車場(chǎng)時(shí),有些停車桿不能及時(shí)抬起,是因?yàn)榭拷\嚄U的行駛角度超出了此前設(shè)定的范圍。”王金橋表示,雖然數(shù)據(jù)標(biāo)簽的質(zhì)量,對(duì)于監(jiān)督學(xué)習(xí)的效果非常重要,但監(jiān)督學(xué)習(xí)不應(yīng)局限于這種模式,應(yīng)該提高對(duì)未知環(huán)境的探索和理解能力。
自監(jiān)督學(xué)習(xí)可利用規(guī)律舉一反三
對(duì)于機(jī)器學(xué)習(xí)的未來(lái),揚(yáng)·勒昆和約舒亞·本吉?dú)W有著相同的期待,他們認(rèn)為,自監(jiān)督學(xué)習(xí)會(huì)創(chuàng)造出更像人類的人工智能。
正如勒昆所解釋的,大多數(shù)人可以在30小時(shí)內(nèi)學(xué)會(huì)駕駛汽車,因?yàn)樗麄円呀?jīng)憑借直覺(jué)構(gòu)建了一個(gè)關(guān)于汽車行動(dòng)方式的物理模型。
“自監(jiān)督學(xué)習(xí)是無(wú)監(jiān)督學(xué)習(xí)中的一種,它可以通過(guò)揭示數(shù)據(jù)各部分之間的關(guān)系、內(nèi)在結(jié)構(gòu),從數(shù)據(jù)中生成標(biāo)簽,這種標(biāo)簽便于對(duì)數(shù)據(jù)進(jìn)行分類。自監(jiān)督學(xué)習(xí)需要學(xué)習(xí)的樣本量很少,但需要有基礎(chǔ)知識(shí)的積累。”王金橋說(shuō)。
王金橋進(jìn)一步解釋,例如下圍棋,如果機(jī)器可以將頂尖高手的棋路都學(xué)會(huì),就能舉一反三。又例如,假設(shè)世界上有5000種蘋果的類型,植物學(xué)家又培育出一種新蘋果,與其他蘋果長(zhǎng)得很像,那么自監(jiān)督學(xué)習(xí)就可以通過(guò)數(shù)據(jù)的分析,識(shí)別出這是蘋果,但又能認(rèn)識(shí)到它是不同于以往的蘋果類型。也就是說(shuō),通過(guò)自監(jiān)督學(xué)習(xí),機(jī)器不需要訓(xùn)練,就可以通過(guò)自動(dòng)分析內(nèi)部數(shù)據(jù)的結(jié)構(gòu)關(guān)系,并且應(yīng)用分析數(shù)據(jù)得到的規(guī)律,對(duì)各種新情況作出判斷。這種能力類似于人,在嬰幼兒時(shí)期,人類能用嗅覺(jué)、觸覺(jué)、視覺(jué)等感知世界,進(jìn)入學(xué)校學(xué)習(xí)后,能將萬(wàn)事萬(wàn)物的物理特征,與知識(shí)結(jié)合起來(lái),慢慢形成推理能力。
王金橋認(rèn)為,這有點(diǎn)類似于勒昆說(shuō)的,自監(jiān)督學(xué)習(xí)無(wú)需創(chuàng)建大量帶有標(biāo)簽的數(shù)據(jù)集,例如用大量貓和狗的圖片,讓機(jī)器認(rèn)識(shí)貓和狗的不同;也不用花費(fèi)數(shù)千個(gè)小時(shí)訓(xùn)練“Alpha Zero”這樣的國(guó)際象棋游戲機(jī)器人,而是只需獲取一些豐富的原始數(shù)據(jù),例如視頻,然后“喂”給計(jì)算機(jī),訓(xùn)練機(jī)器預(yù)測(cè)視頻中即將出現(xiàn)的畫面。
“不管是人類,還是動(dòng)物,在學(xué)習(xí)大多數(shù)事物時(shí),都是在自我監(jiān)督的模式下進(jìn)行的,而不是強(qiáng)化學(xué)習(xí)模式。這個(gè)模式本質(zhì)上就是觀察這個(gè)世界,然后不斷與之增進(jìn)互動(dòng),這種觀察是自發(fā)的,而不是在測(cè)試條件下完成的。”勒昆在2020 ICLR大會(huì)上表示。
達(dá)到類人水平還需算法理論突破
在幾位專家看來(lái),目前想通過(guò)自監(jiān)督學(xué)習(xí)實(shí)現(xiàn)機(jī)器的類人邏輯能力,還前路漫漫。
陳松燦認(rèn)為,自監(jiān)督學(xué)習(xí)需要解決數(shù)據(jù)的不確定性問(wèn)題,即積累的數(shù)據(jù)與要完成的任務(wù)的匹配性問(wèn)題。“例如,利用自監(jiān)督學(xué)習(xí)訓(xùn)練的自動(dòng)駕駛系統(tǒng),可以通過(guò)機(jī)載的測(cè)速儀、方向儀,學(xué)習(xí)安全行駛的方向和速度信息。但以現(xiàn)在的技術(shù)水平來(lái)說(shuō),如果行人橫穿馬路,而此前標(biāo)記的信息與行人橫穿馬路不搭界,那自動(dòng)駕駛系統(tǒng)就會(huì)無(wú)法做出判斷,發(fā)出指令。”
王金橋表示:“從監(jiān)督學(xué)習(xí)到自監(jiān)督學(xué)習(xí),就像先讓機(jī)器知道什么是1234,才能算加減乘除一樣。目前的自監(jiān)督學(xué)習(xí)還非常初級(jí),僅有一些小的、封閉的數(shù)據(jù)集。”
他說(shuō),目前制約自監(jiān)督學(xué)習(xí)的因素涉及大數(shù)據(jù)積累、小樣本監(jiān)督,以及自主進(jìn)化、認(rèn)知未知數(shù)據(jù)的能力。“在數(shù)據(jù)積累階段,還需要把數(shù)據(jù)做得更規(guī)范,搭建的深度學(xué)習(xí)網(wǎng)絡(luò)要有能支持自監(jiān)督學(xué)習(xí)的能力,能讓機(jī)器自己生成標(biāo)簽。在樣本監(jiān)督學(xué)習(xí)階段,要解決樣本不均衡的問(wèn)題,例如要讓機(jī)器學(xué)會(huì)分辨貓和狗,那么貓和狗的案例數(shù)量要匹配,同時(shí)要去除數(shù)據(jù)噪音,不要把干擾圖像混入。”
“關(guān)鍵是要讓自監(jiān)督學(xué)習(xí)產(chǎn)生認(rèn)知的能力,而不只是代替人類的視覺(jué)、聽覺(jué)、觸覺(jué),要從感知智能過(guò)渡到認(rèn)知智能,讓機(jī)器建立自己的知識(shí)圖譜,能與人的思辨能力和知識(shí)圖譜對(duì)接,能進(jìn)行知識(shí)表述和高階推理。”王金橋說(shuō)。
但目前所有的不完美,并不影響兩位圖靈獎(jiǎng)得主的信心。本吉?dú)W認(rèn)為,相比于動(dòng)物,人類之所以聰明,是因?yàn)槲覀冇凶约旱奈幕?,讓我們能夠解決這個(gè)世界的問(wèn)題。要想讓人工智能在現(xiàn)實(shí)世界中發(fā)揮作用,我們需要它不僅僅是有翻譯功能,更需要它能夠真正理解自然語(yǔ)言。
而在勒昆看來(lái),如果說(shuō)人工智能是一塊蛋糕,那么自監(jiān)督學(xué)習(xí)就是其中最大的一塊。
看的辛苦不如直接問(wèn)??! 商標(biāo);專利;版權(quán);法律