近年來(lái)第三代人工智能的討論熱度不斷升溫,特別在張鈸院士發(fā)文 “邁向第三代人工智能”之后,AI TIME精心策劃了一場(chǎng)關(guān)于“如何邁向知識(shí)驅(qū)動(dòng)的人工智能”的PhD Debate,就大家關(guān)心的問(wèn)題邀請(qǐng)了清華大學(xué)的韓旭和于濟(jì)凡、魁北克人工智能研究院的瞿錳、上海交通大學(xué)的晉嘉睿來(lái)為大家?guī)?lái)專題研討。
人工智能60年的歷史中,一共經(jīng)歷了兩代的發(fā)展。
第一代人工智能,優(yōu)勢(shì)在于能夠模仿人類的推理、思考的過(guò)程,利用這個(gè)辦法進(jìn)行機(jī)器學(xué)習(xí)。
第二代人工智能,就是大家非常熟悉的深度學(xué)習(xí),通過(guò)深度神經(jīng)網(wǎng)絡(luò)的模型模擬人類的感知,不需要專家數(shù)據(jù),對(duì)人工的部分要求比較低,而且大規(guī)模神經(jīng)網(wǎng)絡(luò)可以處理大規(guī)模數(shù)據(jù)。
為了彌補(bǔ)前兩代人工智能的不足,嘗試結(jié)合前兩代優(yōu)勢(shì)的第三代人工智能應(yīng)運(yùn)而生,越來(lái)越多的研究者開(kāi)始為第三代人工智能的發(fā)展添磚加瓦。
一、如何得到知識(shí)
連接第一代和第二代人工智能的一個(gè)關(guān)鍵概念是知識(shí),這個(gè)概念在第一代人工智能中以人類定義的符號(hào)為載體,在第二代人工智能中則以機(jī)器從大量樣本中學(xué)習(xí)的特征為載體。
對(duì)于這個(gè)問(wèn)題,大家首先從哲學(xué)的角度上進(jìn)行探討,并認(rèn)為應(yīng)當(dāng)在實(shí)際操作過(guò)程中拋開(kāi)知識(shí)中行而上的部分。
韓旭進(jìn)一步提出了自己的看法,提出知識(shí)可以被看做是高質(zhì)量的信息,信息間有分散與集中之分,我們將分散的信息凝結(jié)為集中的信息的抽象過(guò)程本身就是提取知識(shí)的過(guò)程。在這種框架下,知識(shí)可以進(jìn)一步分為不同的幾層,比如最底層可能是無(wú)結(jié)構(gòu)化的文本信息,進(jìn)一步是結(jié)構(gòu)化的知識(shí)圖譜,再進(jìn)一步抽象,還可以提取出常識(shí)、本體等概念信息等。
瞿錳則討論了知識(shí)對(duì)人類和機(jī)器的不同,有一些知識(shí)是人類可以利用但機(jī)器所不具備,比如人類有一些對(duì)世界的常識(shí),而機(jī)器學(xué)習(xí)出的更多的都是領(lǐng)域的知識(shí)。
晉嘉睿進(jìn)一步提出了在強(qiáng)化學(xué)習(xí)中,有一種方法是利用其它智能體的經(jīng)驗(yàn)來(lái)學(xué)習(xí)的方法,比如模仿學(xué)習(xí)等,這種方法中,其它智能體的經(jīng)驗(yàn)可能就是一種知識(shí)。
對(duì)于如何表示知識(shí)的問(wèn)題,從萊布尼茨開(kāi)始,人們希望可以通過(guò)數(shù)理符號(hào)來(lái)幫助機(jī)器進(jìn)行推理,這是符號(hào)主義的濫觴。而近年來(lái)的深度學(xué)習(xí)的成功則是連接主義的成功。這兩種方向有差異,但沒(méi)有明確的對(duì)錯(cuò)之分,比如簡(jiǎn)單的數(shù)理邏輯,符號(hào)主義的方法會(huì)好過(guò)連接主義,而對(duì)于擬合能力,連接主義顯然更勝一籌。第三代人工智能可以說(shuō)是一種符號(hào)主義和連接主義的結(jié)合。
瞿錳以人類學(xué)習(xí)的方式來(lái)說(shuō)明,有一些可以寫下來(lái)的比如交通規(guī)則,這些可以說(shuō)是符號(hào)主義,有一些需要意會(huì)的,更像是連接主義。另一種是行為主義,模仿專家的規(guī)律,比如學(xué)習(xí)圍棋大師下棋。晉嘉睿提出這些方法和主義都可以看成類腦的想法。
在討論中,于濟(jì)凡提出除了關(guān)注什么是知識(shí),我們還需要關(guān)注什么不是知識(shí)。晉嘉睿提出一種不是知識(shí)的點(diǎn)可能是一千維的數(shù)據(jù)和特征可以學(xué)習(xí)成一百維的知識(shí),另外九百維就不是知識(shí)。韓旭提出對(duì)于人類和機(jī)器來(lái)說(shuō),知識(shí)可能不完全一樣。對(duì)人類友好的知識(shí)形式不見(jiàn)的是對(duì)機(jī)器友好的,我們?cè)谟懻撝R(shí)對(duì)機(jī)器學(xué)習(xí)的作用的時(shí)候應(yīng)當(dāng)考慮這一點(diǎn)。瞿錳在討論中抓住了有用和可以泛化的兩個(gè)關(guān)鍵點(diǎn)可以來(lái)定義知識(shí)。
對(duì)于抽取知識(shí)的方法,韓旭介紹了有關(guān)信息抽取的工作,包括關(guān)系抽取,實(shí)體抽取的方法。瞿錳進(jìn)一步在邏輯的方法,進(jìn)行了闡釋,這些方法可以分為兩大類,一個(gè)是從上而下和另一個(gè)是從下到上的方法。于濟(jì)凡提出在應(yīng)用中,可以提前定義出來(lái),比如一些邏輯。
二、如何利用知識(shí)結(jié)合學(xué)習(xí)的方法
對(duì)于知識(shí)以及邏輯的應(yīng)用,瞿錳將現(xiàn)有的方法歸納為兩種:一種是把知識(shí)當(dāng)作額外的輸入,比如電商在推薦框架中可以進(jìn)一步輸入知識(shí)圖譜,這種方法通過(guò)對(duì)模型架構(gòu)進(jìn)行修改實(shí)現(xiàn)知識(shí)的應(yīng)用;另一種是可以把知識(shí)用作數(shù)據(jù)標(biāo)注,比如用知識(shí)圖譜標(biāo)注數(shù)據(jù),這種方法可以在不改變模型架構(gòu)的前提下實(shí)現(xiàn)知識(shí)的利用。這些方法會(huì)融入概率圖模型,強(qiáng)化學(xué)習(xí)和知識(shí)蒸餾等方法。而這些方法同時(shí)也帶來(lái)了一些挑戰(zhàn),比如可以不可以建立一個(gè)統(tǒng)一的模型將知識(shí)的利用融入到模型的設(shè)計(jì)之中。這些設(shè)計(jì)是不是可以利用神經(jīng)網(wǎng)絡(luò)搜索的方法來(lái)幫助模型來(lái)學(xué)習(xí)。
晉嘉睿進(jìn)一步討論了先可以用學(xué)習(xí)的方法來(lái)預(yù)測(cè)標(biāo)簽,然后利用預(yù)測(cè)標(biāo)簽來(lái)進(jìn)行學(xué)習(xí)。
于濟(jì)凡提出了利用大規(guī)模預(yù)訓(xùn)練的方法將知識(shí)進(jìn)行融合。
韓旭認(rèn)為結(jié)合特定知識(shí)對(duì)不同的任務(wù)或是問(wèn)題單獨(dú)設(shè)計(jì)針對(duì)性的神經(jīng)網(wǎng)絡(luò)會(huì)達(dá)到比較好的效果,預(yù)訓(xùn)練模型更多的是一種整合知識(shí)的方法。有些時(shí)候不是機(jī)器學(xué)習(xí)不好,而可能是人們問(wèn)的方法不對(duì)或是任務(wù)不好。
三、如何利用知識(shí)落地
在定義和表達(dá)之后,另一個(gè)問(wèn)題就是知識(shí)如何落地到現(xiàn)實(shí)生活中,于濟(jì)凡認(rèn)為業(yè)界在知識(shí)圖譜的構(gòu)建已經(jīng)走到了下半場(chǎng),但是知識(shí)圖譜的應(yīng)用還在上半場(chǎng)。第一種場(chǎng)景是利用知識(shí)圖譜來(lái)幫助之前的一些任務(wù),比如電商場(chǎng)景,第二種場(chǎng)景在于知識(shí)相關(guān)度比較高的產(chǎn)業(yè),比如教育等,知識(shí)結(jié)構(gòu)本身就可以作為一個(gè)產(chǎn)品。另一種場(chǎng)景是利用知識(shí)來(lái)幫助人們進(jìn)行決策,知識(shí)可以給國(guó)家政府提供可解釋的決策。
韓旭提出了在將知識(shí)融于一些傳統(tǒng)行業(yè)會(huì)涉及到相關(guān)人員如何適應(yīng)新的人工智能來(lái)輔助的系統(tǒng)。晉嘉睿補(bǔ)充舉例了在阿里電商場(chǎng)景下的知識(shí)和邏輯的應(yīng)用。有一些圖譜的構(gòu)建在現(xiàn)實(shí)生活中是做不到的。于濟(jì)凡提出在弱資源下如何構(gòu)建知識(shí)圖譜依然是一大挑戰(zhàn)。
關(guān)于挑戰(zhàn)和機(jī)遇的問(wèn)題,晉嘉睿補(bǔ)充了在因果推理方面,如何利用反事實(shí)學(xué)習(xí)的方法進(jìn)行學(xué)習(xí)。瞿錳提出了構(gòu)建第三代人工智能的一大瓶頸是新的算法模型,韓旭補(bǔ)充目前的方法在學(xué)習(xí)和推理的結(jié)合方面并沒(méi)有達(dá)到最優(yōu)的表現(xiàn),知識(shí)驅(qū)動(dòng)的人工智能期待新工具的提出和應(yīng)用。