【摘要】本文首先探討了現有人工智能科技的發展狀況,分析了聯結主義、行為主義、符號主義的缺點和不足,進而指出約束智能科學發展的瓶頸所在;其次對智能科學系統中的數據/信息表征、認知模型的構建優缺點進行了概況分析;最后指出人機智能融合系統是未來智能科學的主要發展趨勢。
【關鍵詞】人機 融合 智能 思考
【中圖分類號】TP18 【文獻標識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2017.20.004
《三國演義》第一回即云:“話說天下大勢,分久必合,合久必分。”自然科學中的諸多學科之大勢也莫不如此。人類經歷了數百年的學科精分細化,目前隨著人工智能的快速發展,許多學科正在慢慢交叉融合起來。在經歷了三次起伏(即上世紀70年代后期對數學定理證明非萬能的清醒、90年代后期對專家系統與五代機的失望、2006年深度學習掀起了新一輪的浪潮)之后,人們狂熱的希望逐漸踏實了很多,目光和注意力也慢慢地從癡迷科幻轉移到了一個嶄新而又富有活力的領域:人機融合智能領域。
現有人工智能的不足
從歷史上看,人工智能大概分三大門派,一是以模仿大腦皮層神經網絡及神經網絡間的連接機制與學習算法的聯結主義(Connectionism),主要表現為深度學習方法,即用多隱層的處理結構處理各種大數據;二是以模仿人或生物個體、群體控制行為功能及感知—動作型控制系統的行為主義(Actionism),主要表現為具有獎懲控制機制的強化學習方法,即通過行為增強或減弱的反饋來實現輸出規劃的表征;三是以物理符號系統(即符號操作系統)具有產生智能行為的充分必要條件假設(Newell and Simon, 1976)和有限理性原理為代表的符號主義(Symbolicism),主要表現為知識圖譜應用體系,即用模擬大腦的邏輯結構來加工處理各種信息和知識。正是由于這三種人工智能派別的取長補短,再結合蒙特卡洛算法(兩種隨機算法中的一種,如果問題要求在有限采樣內,必須給出一個解,但不要求是最優解,那就要用蒙特卡羅算法。反之,如果問題要求必須給出最優解,但對采樣沒有限制,那就要用拉斯維加斯算法)使得特定領域的人工智能系統超過人類的智能成為了可能,如IBM的Waston問答系統和Google Deepmind的AlphaGo圍棋系統等。盡管這些人工智能系統取得了驕人的績效,但仍有不少缺陷和不足之處,而且還有可能產生很大的隱患和危險。
首先分析一下讓人工智能在當下火熱燙手的聯結主義。當前的人工智能之所以高燒不退,其主要的力量源泉是2006年Hinton提出的深度學習方法大大提高了圖像識別、語音識別等方面的效率,并在無人駕駛、“智慧+”某些產業中切實體現出助力作用。然而,任何一種算法都有其不完備性,深度學習算法也不例外。該方法的局限性和不足是最好使用在具有可微分(函數連續)、強監督(樣本數據標定很好、樣本類別/屬性/評價目標恒定)學習、封閉靜態系統(干擾少、魯棒性好、不復雜)任務下,而對于不可微分、弱監督學習(樣本分布偏移大、新類別多、屬性退化嚴重、目標多樣)、開放動態環境下該方法效果較差,計算收斂性不好。另外,相對于其他機器學習方法,使用深度學習生成的模型非常難以解釋。這些模型可能有許多層和上千個節點;單獨解釋每一個是不可能的。數據科學家通過度量它們的預測結果來評估深度學習模型,但模型架構本身是個“黑盒”。它有可能會讓你在不知不覺間失去“發現錯誤”的機會。再者,如今的深度學習技術還有另一個問題,它需要大量的數據作為訓練基礎,而訓練所得的結果卻難以應用到其他問題上。如何在各種現實情境任務中恰如其分地解決這些問題,就需要結合其他的方法取長補短、協調配合。
其次,對于行為主義中的增強學習,它的優點是能夠根據交互作用中的得失進行學習績效的累積,與人類真實的學習機制相似。該方法最主要的缺點是把人的行為過程看得太過簡單,實驗中往往只是測量簡單的獎懲反饋過程,有些結論不能遷移到現實生活中,所以外部效度不高。還有,行為主義銳意研究可以觀察的行為,但是由于它的主張過于極端,不研究心理的內部結構和過程,否定意識的重要性,進而將意識與行為對立起來,限制了人工智能的縱深發展。
最后是符號主義及其知識圖譜,符號主義屬于現代人工智能范疇,基于邏輯推理的智能模擬方法模擬人的智能行為。該方法的實質就是模擬人的大腦抽象邏輯思維,通過研究人類認知系統的功能機理,用某種符號來描述人類的認知過程,并把這種符號輸入到能處理符號的計算機中,就可以模擬人類的認知過程,從而實現人工智能。可以把符號主義的思想簡單歸結為“認知即計算”。從符號主義的觀點來看,知識是信息的一種形式,是構成智能的基礎,知識表示、知識推理、知識運用是人工智能的核心,知識可用符號表示,認知就是符號的處理過程,推理就是采用啟發式知識及啟發式搜索對問題求解的過程,而推理過程又可以用某種形式化的語言來描述,因而有可能建立起基于知識的人類智能和機器智能的同一理論體系。目前知識圖譜領域面臨的主要挑戰問題包括:1.知識的自動獲取;2.多源知識的自動融合;3.面向知識的表示學習;4.知識推理與應用。符號主義主張用邏輯方法來建立人工智能的統一理論體系,但卻遇到了“常識”問題的障礙,以及不確知事物的知識表示和問題求解等難題,因此,受到其他學派的批評與否定。
從上述人工智能三大流派的特點及缺點分析,我們不難看出:人的思維很難在人工智能現有的理論框架中得到解釋。那該如何做才有可能尋找到一條通往智能科學研究光明前程之路呢?下面我們將針對這個問題展開最基礎的思考和討論。
約束智能科學發展的瓶頸是什么
人工智能之父圖靈的朋友和老師維特根斯坦在他著名的《邏輯哲學論》中第一句就寫道:“世界是事實的總和而非事物的總和”,其中的事實指的是事物之間的關涉聯系——關系,而事物是指包含的各種屬性,從目前人工智能技術的發展態勢而言,絕大多數都是在做識別事物屬性方面的工作,如語音、圖像、位置、速度等,而涉及到事物之間的各種關系層面的工作還很少,但是已經開始做了,如大數據挖掘等。在這眼花繚亂的人工智能技術中,人們常常思考著這樣一個問題:什么是智能?智能的定義究竟是什么呢?
關于智能的定義,有人說是非存在的有,有人說是得意忘形,有人說是隨機應變,有人說是魯棒適應,有人說……,可能有一百個專家,就有一百種說法。實際上現在要形成一個大家都能接受的定義是不太可能的。但是這并不影響大家對智能研究中的一些難點、熱點達成一致看法或共識。比如信息表征、邏輯推理和自主決策等方面。
一般而言,任何智能都是從數據輸入開始的,對人而言數據就是各種刺激(眼耳鼻舌身),對機器而言就是各種傳感器采集到的各種數據,數據是相對客觀的,而從中提煉出有價值的數據——信息卻是相對主觀的,信息已經開始帶有人的價值觀、偏好傾向和風俗習慣。人機處理數據最大的差異在于形成信息的表征,機器中的數據常常是結構化歸一量化后的“標準數據”,數據表征的符號就是0、1或其他進制的數字;人采集到的數據則是各種非結構化、非一致性不同量綱種類的刺激輸入,其表征方式是極其靈活多變的,對一朵花、一棵樹甚至可以有無限多種表征,正可謂是“一花一世界、一樹一菩提”,而且表征出的信息符號是由“能指”和“所指”構成的,“能指”指具體的物理刺激形象,“所指”指信息所反映的事物的概念及拓撲關系。比如,對于一杯水,機器可能表征它為高度、寬度、密度、顏色等客觀數值參數,而人除此之外,還可以把它表征為熱情、友誼、問候、送客等方面的多維內涵外延拓展,這種千差萬別的混合指向變化,機器無論如何是表征不出、處理不了的,所以,從智能的源頭就可以找到人工智能與人類智能的根本區別之所在。數據的變化與動態映射是感知的瓶頸,人會期望性的補償或回望性的修正,而機器就是把過去性(數據)當成當下來處理,若數據處于過程中不敏感還好些,若是臨界性數據,就常常會差之毫厘謬以千里了。數據、信息、知識、邏輯本質上就是事物之間不同程度的關系表征,這種表征可以體現在人的記憶和直覺之間,也可以顯示于機器的存儲與計算之中。只不過機器數據的單一表征從一開始就異于人的多種刺激融合,這也是機器不能產生類人意向性的主要原因:缺乏靈活的一多分有(內涵外延伸張彌聚有度自如)的表征機制。
有人認為符號化和對象化可能是兩個不同的步驟。一個對象可以沒有符號名字,也可以有多個符號名字,一個符號可以表示多個不同對象。智能的理解要做到符號到對象的指向性,沒有做到指向性,只是符號間關系的處理,不能算理解。實際上對人而言感與知往往是同步的,在形成習慣風俗后,對象與符號應該也是融合的。
有了數據和信息之后,智能的信息處理架構就格外的重要,到目前為止,有不少大家提出了一些經典的理論或模型,例如在視覺領域,David Marr的三層結構至今仍為許多智能科技工作者所追捧。作為視覺計算理論的創始人Marr認為:神經系統所作的信息處理與機器相似。視覺是一種復雜的信息處理任務,目的是要把握對我們有用的外部世界的各種情況,并把它們表達出來。這種任務必須在三個不同的水平上來理解,這就是:計算理論、算法、機制(見表)。
Marr早先提出的一些基本概念在計算理論這一級水平上已經成為一種幾乎是盡善盡美的理論。這一理論的特征就是它力圖使人的視覺信息處理研究變得越來越嚴密,從而使它成為一門真正的科學。
當前,在解釋人類認知過程工作機理的理論中,由卡耐基梅隆大學教授John Robert Anderson提出的ACT-R(Adaptive Control of Thought–Rational, ACT-R)模型被認為是非常具有前途的一個理論。該理論模型認為人類的認知過程需要四種不同的模塊參與,即目標模塊、視覺模塊、動作模塊和描述性知識模塊。每一個模塊各自獨立工作,并且由一個中央產生系統協調。ACT-R的核心是描述性知識模塊和中央產生系統。描述性知識模塊存儲了個體所積累的長期不變的認識,包括基本的事實(例如“西雅圖是美國的一座城市”)、專業知識(例如“高速鐵路交通信號控制方案的設計方法”)等。中央產生式系統存儲了個體的程序性知識,這些知識以條件—動作(產生式)規則的形式呈現,當滿足一定條件時,相應的動作將被對應的模塊執行,產生式規則的不斷觸發能夠保證各個模塊相互配合,模擬個體做出的連續認知過程。ACT-R是一種認知架構,用以仿真并理解人的認知的理論。ACT-R試圖理解人類如何組織知識和產生智能行為。ACT-R的目標是使系統能夠執行人類的各種認知任務,如捕獲人的感知、思想和行為。
無論是David Marr的三層結構計算視覺理論,還是John Robert Anderson提出的ACT-R理論模型,以及許多解釋和模擬人類認知過程的模型都存在一個共同的缺點和不足,即不能把人的主觀參數和機器/環境中的客觀參數有機地統一起來,模型的彈性不足,很難主動地產生魯棒性的適應性,更不要說產生情感、意識等更高層次的表征和演化。當前的人工智能與人相比除了在輸入表征和融合處理方面的局限外,在更基本的哲學層面就存在這先天不足,即回答不了休謨問題。
休謨問題是指英國哲學家大衛·休謨(David Hume)1711年在《人性論》的第一卷和《人類理智研究》里面提出來的。首先提出的是個未能很好解決的哲學問題,主要是指因果問題和歸納問題,即所謂從“是”(being)能否推出“應該”(should),也即“事實”命題能否推導出“價值”命題。休謨指出,由因果推理獲得的知識,構成了人類生活所依賴的絕大部分知識。這個由休謨對因果關系的普遍性、必然性進行反思所提出的問題被康德稱為“休謨問題”。休謨問題表面上是一個著名的哲學難題,實際上更是一個人工智能的瓶頸和難點,當把數據表征為信息時,能指就是相對客觀表示being,而所指就是主觀表達should。
從認識論角度,“應該”就是從描述事物狀態與特征的參量(或變量)的眾多數值中取其最大值或極大值,“是”就是從描述事物狀態與特征的參量(或變量)的眾多數值中取其任意值。從價值論角度,“應該”就是從描述事物的價值狀態與價值特征的眾多參量(或變量)中取其最大值或極大值,“是”就是從描述事物價值是狀態與價值特征的參量(或變量)的眾多數值中取其任意值。
由于受偏好、習慣、風俗等因素的影響,即使是人類的認識論和價值論也經常出現非因果歸納和演繹(比如嚴格意義上而言,從“天行健”這個事實(being)命題是不能推出“君子必自強不息”這個價值觀(should)命題的,但是隨著時間的延續,這個類比習慣漸漸變成了有些因果的意味)。人工智能的優勢不僅在于存儲量大計算速度快,更重要的是它還沒有偏見的頭腦且認知封閉,但是要處理類似雖是由人類提出的但仍遠遠不能完美回答的休謨問題恐怕還是強機所難吧!人工智能如果有一定的智能,恐怕更多的應是數字邏輯語言智能,在特定場景、既定規則和統計既定輸出的任務下可以極大提升工作效率,但在有情感、有意向性的復雜情境下仍難以無中生有、隨機應變。未來智能科學的發展趨勢必將會是人機智能的不斷融合促進。
未來是人機智能的融合
人機智能融合,簡單地說就是充分利用人和機器的長處形成一種新的智能形式。
英國首相丘吉爾曾經說過:“你能看到多遠的過去,你就能看到多遠的未來”,所以我們有必要看看人機智能融合的過去。任何新的事物都有其產生的源泉,人機智能融合也不例外,其主要起源于人機交互和智能科學這兩個領域,而這兩個領域起源都與英國劍橋大學有著密切的關系:1940年夏,當德國轟炸機飛向倫敦之際,人機交互與智能科學的研究序幕就被徐徐拉開了……英國人為了抵御德國人的進攻,開始了雷達、飛機、密碼破譯方面的科技應用工作,當時在劍橋大學圣約翰學院建立了第一個研究人機交互問題的飛機座艙(即著名的Cambridge Cockpit)以解決飛行員們執行飛行任務時出現的一些錯誤和失誤,另外劍橋國王學院的畢業生圖靈領導了對德軍“恩尼格瑪”密電文的破譯……事實上,早在19世紀,劍橋大學的查爾斯·巴貝奇和阿達·奧古斯塔(劍橋大學畢業生、詩人拜倫的女兒,世界第一位程序員)就開始合作進行機械計算機軟硬件的研制,20世紀之后,數學家羅素、邏輯學家維特根斯坦(圖靈的老師和朋友)都對智能科學的起源和發展做出了重大的貢獻。當前人機智能融合領域比較火的兩位深度學習之父辛頓曾是劍橋大學心理系的學生、阿爾法狗之父哈撒比斯本科是劍橋計算機系畢業的……
在人機智能融合時,有一件事非常重要,就是這個人要能夠理解機器如何看待世界,并在機器的限制內有效地進行決策。反之,機器也應對配合的人比較“熟悉”,就像一些體育活動中的雙打隊友一樣,如果彼此間沒有默契,想產生化學變化般的合適融合、精確協同就是天方夜譚。有效的人機智能融合常常意味著將人的思想帶給機器,這也就意味著:人將開始有意識地思考他通常無意識間執行的任務;機器將開始處理合作者個性化的習慣和偏好;兩者都還必須隨時隨地隨環境的變化而變化……高山流水,電腦與心靈相互感應,充分發揮兩者的優點和長處,如人類可以打破邏輯運用直覺思維進行決策、機器能夠檢測人類感覺無法檢測到的信號能力等。人類所理解的每一個命題,都必定全然是由我們所獲知的各種成分所組成的。意識是一種對隱顯關系的梳理,有時表現為直覺。
人的直覺是同化、順應之間的自由轉換,能夠靈活自如地進行不完全歸納和彈性演繹,更重要的是:這一切都是由內而外的自主行為。直覺經驗本質上是一種感性、一種自動意識性關聯和得意忘形。直覺是把存在性、可能性、意向性、潛在性勾兌顯化的一種方式,也是把零碎、散化的數據信息知識進行非常邏輯表征,其中的粘合劑就是情感(機器所不具備的能力)——一種獨特的智能——情智,直覺本質上就是通情達理,能夠隱約看見許多通過理性邏輯看不到的關系、聯系,從而把許多平時風馬牛不相及的屬性、成分(包括主觀臆想客觀存在)關聯在一起形成某種意向性的可能存在。而機器更適合于分類聚類,利用人類部分可以描述化、程序化的形式語言實現強監督學習、構建認知模型、輔助決策等方面。當前,人機之間的理解都是單向性的,彼此之間的學習也是,只不過逐漸開始出現了雙向性的苗頭,人機之間開始理解一些以前認為不含理解成分的對象和事物,慢慢把人的主動性與機的被動性有效地混合起來。人處理其擅長的包含“應該”(should)等價值取向的主觀信息,機器則計算其拿手的涉及“是”(being)等規則概率統計的客觀數據,進而把休謨之問變成了一個可執行可操作的程序性問題,也是把客觀數據與主觀信息統一起來的新機制,即需要意向性價值的時候由人來處理,需要形式化(數字化)的事實時候由機器來分擔,從而產生了一種人+機大于人、人+機大于機的效果。
人機智能融合中深度態勢感知是一個重要隘口,深度態勢感知含義是“對態勢感知的感知,是一種人機智慧,既包括了人的智慧,也融合了機器的智能(人工智能)”,是能指+所指,既涉及事物的屬性(能指、感覺)又關聯它們之間的關系(所指、知覺),既能夠理解事物原本之意,也能夠明白弦外之音。它是在以Endsley為主體的態勢感知(包括信息輸入、處理、輸出環節)基礎上,加上人、機(物)、環境(自然、社會)及其相互關系的整體系統趨勢分析,具有“軟/硬”兩種調節反饋機制;既包括自組織、自適應,也包括他組織、互適應;既包括局部的定量計算預測,也包括全局的定性算計評估,是一種具有自主、自動彌聚效應的信息修正、補償的期望—選擇—預測—控制體系。
相比起人工智能來,我們更愿意談人機智能融合,也許人工智能更偏應用和技術,談人機智能融合則可以更基礎一些。另外,需要注意的是,人機智能融合本身不僅僅是科學問題,還涉及到其他學科,如人文藝術、哲學,甚至還有宗教神學。還有,智能不是人類獨有的能力,還關涉其他生命體,比如動物、植物等,那么究竟什么是智能呢?美國第一屆心理學會主席威廉·詹姆斯說的一句話或許可見一斑:“智慧是一種忽略的藝術。”
單純的計算應該是沒有大的突破,認知+計算可能是未來。如果把認知看成美女,計算視作野獸,未來的智能科學就是美女與野獸,而數據則是美女牽著野獸的韁繩。要把這樣的機遇變成現實,就需要與目前AI研究方向不同的新的研究課題,比如需要探索認知科學對于人類與動物如何學習與推理的研究,將其與計算科學結合,整合成最終能以人類的方式工作的系統。Being與should的狹義結合就是數據與知識、結構與功能、感知與推理、直覺與邏輯、聯接與符號、屬性與關系的結合,也是未來智能體系的發展趨勢……其廣義結合是意向性與形式化、美女與野獸的結合。人工智能的美女派主要抓關系產生的關系,野獸派主要抓屬性產生的關系。臨界,這是一種介于有序和無序之間的狀態,是工作效率最大化的一種表現形式。人機智能融合就是要尋找到這種平衡狀態,讓人的無序與機的有序、人的有序與機的無序相得益彰,達到安全、高效、敏捷的結果。
既然我們很多時候無從得知因果之間的關系,只能得知某些事物總是會連結在一起。那么我們有什么理由從對個別事例的觀察中引出普遍性的結論呢?想象力、創造力是感性與理性的界面,也許人機智能的融合可以實現一定程度上主客觀、感性與理性的相互適應性融合吧!
參考文獻
Turing A M, 1950, "Computing machinery and intelligence", Mind, 59(236).
司馬賀,2004,《人工科學》,武夷山譯,上海科技教育出版社。
Lighthill I., 1973, "Artificial intelligence: A general survey", Artificial Intelligence: A Paper Symposium, London: Science Research Council.
劉偉、袁修干,2008,《人機交互設計與評價》,北京:科學出版社。
[英]休謨,2014,《人性論》,石碧球譯,南昌:江西教育出版社。
R.M.Harnish, 2008, Minds, Brains, Computer: An Historical Introduction to the Foundations of Cognitive Science, Oxford: Blackwell Publishing Ltd.
José Luis Bermúdez, 2010, Cognitive Science, Cambridge: Cambridge University Press.
Anderson C. , 2006, " The long tail: Why the future of business is selling less of more", Journal of Product Innovation Management, 24(3).
Hawkins J, Blakeslee S. , 2004 , On intelligence, Times Books.
Kurzweil R., 2006, "The singularity is near: When humans transcend biology", Cryonics, 85(1).
劉偉,2016,《關于人工智能若干重要問題的思考》,《人民論壇·學術前沿》,4月上。
責 編/馬冰瑩
Intelligent Man-machine Fusion: The Future of Artificial Intelligence
Liu Wei
Abstract: This paper first discusses the current development of artificial intelligence technology, analyzes the shortcomings and deficiencies of Connectionism, Actionism and Symbolism, and then points out the bottleneck constricting the development of intelligence science. Secondly, it briefly studies the advantages and disadvantages of the data/information representation and cognitive model construction in the intelligent science system. Finally, it holds that intelligent man-machine fusion is the main development trend of future intelligence science.
Keywords: Man-machine, fusion, intelligence, thinking
劉偉,北京郵電大學自動化學院崗位教授、人機交互與認知工程實驗室主任。研究方向為人機交互、認知工程、用戶體驗、人機環境系統工程、分析哲學、未來態勢感知模式與行為分析/預測技術。主要著作有《人機交互設計與評價》等。